質問編集履歴

書式の改善

2017/12/11 16:33

投稿

退会済みユーザー

スコア0

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -4,87 +4,7 @@
-・predicted_labelsは、初期設定しているもののその後にデータが与えれておらず空の状態なので、test_dataYはエラーメッセージからすると21,000件なのでそれに見合った件数の予測結果を引数に設定する方法を教えてください。
-エラー
-```python
----------------------------------------------------------------------------
-ValueError                                Traceback (most recent call last)
-<ipython-input-5-f6ad643389d7> in <module>()
+・今の状態だとK=1の時でしか混合行列がわからないのでKが１以外の時を指定して表示させるにはどうすればいいですか
-     29
-     30 if __name__ == '__main__':
----> 31     main()
-<ipython-input-5-f6ad643389d7> in main()
-     21
-     22     # 正解率を計算
----> 23     score = accuracy_score(test_dataY, predicted_labels)
-     24     print("正解率:{}".format(score))
-     25
-~\Anaconda3\lib\site-packages\sklearn\metrics\classification.py in accuracy_score(y_true, y_pred, normalize, sample_weight)
-    174
-    175     # Compute accuracy for each possible representation
---> 176     y_type, y_true, y_pred = _check_targets(y_true, y_pred)
-    177     if y_type.startswith('multilabel'):
-    178         differing_labels = count_nonzero(y_true - y_pred, axis=1)
-~\Anaconda3\lib\site-packages\sklearn\metrics\classification.py in _check_targets(y_true, y_pred)
-     69     y_pred : array or indicator matrix
-     70     """
----> 71     check_consistent_length(y_true, y_pred)
-     72     type_true = type_of_target(y_true)
-     73     type_pred = type_of_target(y_pred)
-~\Anaconda3\lib\site-packages\sklearn\utils\validation.py in check_consistent_length(*arrays)
-    202     if len(uniques) > 1:
-    203         raise ValueError("Found input variables with inconsistent numbers of"
---> 204                          " samples: %r" % [int(l) for l in lengths])
-    205
-    206
-ValueError: Found input variables with inconsistent numbers of samples: [21000, 1]
-```
@@ -124,7 +44,7 @@
 def main():
     # 特徴データとラベルデータを取り出す
@@ -132,49 +52,55 @@
     targets = mnist.target
     #データを分割
     train_dataX, test_dataX, train_dataY, test_dataY = model_selection.train_test_split(features,targets,test_size=0.3)
+    # 検証する近傍数
+    K = 1
-    predicted_labels = []
+    ks = range(1, K + 1)
-    # モデルを学習
+    for k in ks:
-    model = KNeighborsClassifier(n_neighbors=1, metric='euclidean')
+        predicted_labels = []
+        # モデルを学習
+        model = KNeighborsClassifier(n_neighbors=1, metric='euclidean')
-    model.fit(train_dataX,train_dataY)
+        model.fit(train_dataX,train_dataY)
-    # 一つだけ取り除いたテストデータを識別
+        # 一つだけ取り除いたテストデータを識別
-    predicted_label = model.predict(test_dataX)
+        predicted_label = model.predict(test_dataX)
-    predicted_labels.append(predicted_label)
+        predicted_labels.append(predicted_label)
-    ## print(predicted_labels)
     # 正解率を計算
-    score = accuracy_score(test_dataY, predicted_labels)
+    score = accuracy_score(test_dataY, predicted_label)
     print("正解率:{}".format(score))
     # 混合行列を表示
-    cm = confusion_matrix(test_dataY, predicted_labels)
+    cm = confusion_matrix(test_dataY, predicted_label)
     print(cm)