回答編集履歴

追記

2018/06/15 17:24

投稿

hayataka2049

スコア30939

test CHANGED Viewed

@@ -1,3 +1,67 @@
 40件のデータで`validation_split=0.1`って、4件でバリデーションすることになります。各動作1つずつ。これは各ラベルごとに均等に振られる保障とかもないらしいので、なんだか怪しいです。
 他のミスとか見落としているかもしれませんが、とりあえず最初に気になったのはそこです。0.5くらいにしたら平然と動いたりしませんか。
+### 追記
+```python
+y_keras=keras.utils.to_categorical(y,n_classes)
+```
+以下を消してこのコードを挿入。交差検証した正解率が出てきます。
+```python
+from sklearn.ensemble import RandomForestClassifier
+from sklearn.naive_bayes import GaussianNB
+from sklearn.model_selection import cross_validate
+# 以下4行は消す。消さないでこのコードだけ1つのファイルにまとめて書くと、digitsで動く
+from sklearn.datasets import load_digits
+digits = load_digits()
+X = digits.data  # X=np.array(df)で作ったXになるように
+y = digits.target  # y=np.array([0,1,1,1,1,...で作ったyになるように
+rfc = RandomForestClassifier(n_estimators=1000, n_jobs=-1)
+gnb = GaussianNB()
+for name, clf in zip(["RandomForest", "GaussianNB"], [rfc, gnb]):
+    d = cross_validate(clf, X, y, cv=4, scoring="accuracy", n_jobs=-1)
+    print(name)
+    print("accuracy:{:.5f}".format(d["test_score"].mean()))
+""" =>　こんな感じ
+RandomForest
+accuracy:0.94273
+GaussianNB
+accuracy:0.80866
+"""
+```