編集履歴

質問編集履歴

clf = svm.SVC() clf.fit(train_data, label_train) pre = clf.predict()　を削除

2017/11/28 09:07

投稿

退会済みユーザー

スコア0

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -7,16 +7,17 @@
 ・容量が大きくて実行できない。
-・TypeError                                 Traceback (most recent call last)
+・NameError                                 Traceback (most recent call last)
-<ipython-input-20-71497c22a695> in <module>()
+<ipython-input-24-b95cedfc1745> in <module>()
-      4 clf = svm.SVC()
-      5 clf.fit(train_data,  label_train)
+     28         print('k={0}: {1}'.format(k, ac_score))
+     29
-----> 6 pre = clf.predict()
+---> 30         accuracy_scores.append(score)
-      7
+     31
-      8  # 使う近傍数ごとに正解率＆各経過時間を計算
+     32         # 各経過時間を表示
-TypeError: predict() missing 1 required positional argument: 'X'
+NameError: name 'score' is not defined
+・Digitsデータではそのようなエラーはなかった
 ###Digitsデータで最適なkを探すknnのプログラム
@@ -78,12 +79,10 @@
 train_size = 500
 test_size = 100
 train_data, test_data, label_train, label_test = model_selection.train_test_split(mnist_data, mnist_label, test_size=test_size, train_size=train_size)
 K = 10
 ks = range(1, K + 1)
-clf = svm.SVC()
-clf.fit(train_data,  label_train)
-pre = clf.predict()
  # 使う近傍数ごとに正解率＆各経過時間を計算
 accuracy_scores = []
@@ -103,7 +102,7 @@
         model.fit(train_data, label_train)
         # 一つだけ取り除いたテストデータを識別
-        predicted_label = model.predict(features[test])
+        predicted_label = model.predict(train_data[test])
         predicted_labels.append(predicted_label)
         # 正解率を計算

修正しました。

2017/11/28 09:07

投稿

退会済みユーザー

スコア0

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -7,7 +7,18 @@
 ・容量が大きくて実行できない。
+・TypeError                                 Traceback (most recent call last)
+<ipython-input-20-71497c22a695> in <module>()
+      4 clf = svm.SVC()
+      5 clf.fit(train_data,  label_train)
+----> 6 pre = clf.predict()
+      7
+      8  # 使う近傍数ごとに正解率＆各経過時間を計算
+TypeError: predict() missing 1 required positional argument: 'X'
 ###Digitsデータで最適なkを探すknnのプログラム
 ```python
 from matplotlib import pyplot as plt
@@ -66,14 +77,13 @@
 train_size = 500
 test_size = 100
-train_data, test_data_, label_train, label_test = model_selection.train_test_split(mnist_data, mnist_label, test_size=test_size, train_size=train_size)
+train_data, test_data, label_train, label_test = model_selection.train_test_split(mnist_data, mnist_label, test_size=test_size, train_size=train_size)
 K = 10
 ks = range(1, K + 1)
 clf = svm.SVC()
-clf.fit(train_data,  target_data)
+clf.fit(train_data,  label_train)
-pre = clf.predict(data_test)
+pre = clf.predict()
  # 使う近傍数ごとに正解率＆各経過時間を計算
 accuracy_scores = []
@@ -81,16 +91,17 @@
 for k in ks:
     predicted_labels = []
     loo = LeaveOneOut()
     for train, test in loo.split(mnist.data):
         train_data = mnist.data[train]
-        target_data = mnist.target[train]
+        label_train = mnist.target[train]
         elapsed_time = time.time() - start
         # モデルを学習させる
         model = KNeighborsClassifier(n_neighbors=k)
-        model.fit(train_data, target_data)
+        model.fit(train_data, label_train)
         # 一つだけ取り除いたテストデータを識別
         predicted_label = model.predict(features[test])
         predicted_labels.append(predicted_label)

書式の改善

2017/11/28 08:50

投稿

退会済みユーザー

スコア0

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -61,18 +61,18 @@
 if __name__ == '__main__':
     main()
 ```
-###mnistデータで最適なkを探すknnのプログラム現段階
+###mnistデータで最適なkを探すknnのプログラム　改善版
 ```python
 train_size = 500
 test_size = 100
-data_train, data_test, label_train, label_test = model_selection.train_test_split(mnist_data, mnist_label, test_size=test_size, train_size=train_size)
+train_data, test_data_, label_train, label_test = model_selection.train_test_split(mnist_data, mnist_label, test_size=test_size, train_size=train_size)
 K = 10
 ks = range(1, K + 1)
 clf = svm.SVC()
-clf.fit(data_train, label_train)
+clf.fit(train_data,  target_data)
 pre = clf.predict(data_test)
  # 使う近傍数ごとに正解率＆各経過時間を計算
@@ -82,8 +82,8 @@
     predicted_labels = []
     loo = LeaveOneOut()
     for train, test in loo.split(mnist.data):
-        data_train = mnist.data[train]
+        train_data = mnist.data[train]
-        data_test = mnist.target[train]
+        target_data = mnist.target[train]
         elapsed_time = time.time() - start

誤字

2017/11/28 08:26

投稿

退会済みユーザー

スコア0

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -60,9 +60,10 @@
 if __name__ == '__main__':
     main()
+```
 ###mnistデータで最適なkを探すknnのプログラム現段階
 ```python
 train_size = 500
 test_size = 100
 data_train, data_test, label_train, label_test = model_selection.train_test_split(mnist_data, mnist_label, test_size=test_size, train_size=train_size)

書式の改善

2017/11/28 07:42

投稿

退会済みユーザー

スコア0

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -6,39 +6,10 @@
 ###発生している問題・エラーメッセージ
 ・容量が大きくて実行できない。
-・ValueError                                Traceback (most recent call last)
-<ipython-input-10-c9ec06272b57> in <module>()
-      3
-      4 clf = svm.SVC()
-----> 5 clf.fit(data_train, label_train)
-      6 pre = clf.predict(data_test)
-      7
-~\Anaconda3\lib\site-packages\sklearn\svm\base.py in fit(self, X, y, sample_weight)
-    147         self._sparse = sparse and not callable(self.kernel)
-    148
---> 149         X, y = check_X_y(X, y, dtype=np.float64, order='C', accept_sparse='csr')
-    150         y = self._validate_targets(y)
-    151
-~\Anaconda3\lib\site-packages\sklearn\utils\validation.py in check_X_y(X, y, accept_sparse, dtype, order, copy, force_all_finite, ensure_2d, allow_nd, multi_output, ensure_min_samples, ensure_min_features, y_numeric, warn_on_dtype, estimator)
-    581         y = y.astype(np.float64)
-    582
---> 583     check_consistent_length(X, y)
-    584
-    585     return X, y
-~\Anaconda3\lib\site-packages\sklearn\utils\validation.py in check_consistent_length(*arrays)
-    202     if len(uniques) > 1:
-    203         raise ValueError("Found input variables with inconsistent numbers of"
---> 204                          " samples: %r" % [int(l) for l in lengths])
-    205
-    206
-ValueError: Found input variables with inconsistent numbers of samples: [69999, 500]
 ###Digitsデータで最適なkを探すknnのプログラム
+```python
 from matplotlib import pyplot as plt
 from sklearn import datasets
 from sklearn.model_selection import LeaveOneOut

現段階とエラー

2017/11/28 07:39

投稿

退会済みユーザー

スコア0

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -5,9 +5,38 @@
 ###発生している問題・エラーメッセージ
-容量が大きくて実行できない。
+・容量が大きくて実行できない。
+・ValueError                                Traceback (most recent call last)
+<ipython-input-10-c9ec06272b57> in <module>()
+      3
+      4 clf = svm.SVC()
+----> 5 clf.fit(data_train, label_train)
+      6 pre = clf.predict(data_test)
+      7
+~\Anaconda3\lib\site-packages\sklearn\svm\base.py in fit(self, X, y, sample_weight)
+    147         self._sparse = sparse and not callable(self.kernel)
+    148
+--> 149         X, y = check_X_y(X, y, dtype=np.float64, order='C', accept_sparse='csr')
+    150         y = self._validate_targets(y)
+    151
+~\Anaconda3\lib\site-packages\sklearn\utils\validation.py in check_X_y(X, y, accept_sparse, dtype, order, copy, force_all_finite, ensure_2d, allow_nd, multi_output, ensure_min_samples, ensure_min_features, y_numeric, warn_on_dtype, estimator)
+    581         y = y.astype(np.float64)
+    582
+--> 583     check_consistent_length(X, y)
+    584
+    585     return X, y
+~\Anaconda3\lib\site-packages\sklearn\utils\validation.py in check_consistent_length(*arrays)
+    202     if len(uniques) > 1:
+    203         raise ValueError("Found input variables with inconsistent numbers of"
+--> 204                          " samples: %r" % [int(l) for l in lengths])
+    205
+    206
+ValueError: Found input variables with inconsistent numbers of samples: [69999, 500]
 ###Digitsデータで最適なkを探すknnのプログラム
 from matplotlib import pyplot as plt
@@ -61,7 +90,58 @@
 if __name__ == '__main__':
     main()
+###mnistデータで最適なkを探すknnのプログラム現段階
+```python
+train_size = 500
+test_size = 100
+data_train, data_test, label_train, label_test = model_selection.train_test_split(mnist_data, mnist_label, test_size=test_size, train_size=train_size)
+K = 10
+ks = range(1, K + 1)
+clf = svm.SVC()
+clf.fit(data_train, label_train)
+pre = clf.predict(data_test)
+ # 使う近傍数ごとに正解率＆各経過時間を計算
+accuracy_scores = []
+start = time.time()
+for k in ks:
+    predicted_labels = []
+    loo = LeaveOneOut()
+    for train, test in loo.split(mnist.data):
+        data_train = mnist.data[train]
+        data_test = mnist.target[train]
+        elapsed_time = time.time() - start
+        # モデルを学習させる
+        model = KNeighborsClassifier(n_neighbors=k)
+        model.fit(train_data, target_data)
+        # 一つだけ取り除いたテストデータを識別
+        predicted_label = model.predict(features[test])
+        predicted_labels.append(predicted_label)
+        # 正解率を計算
+        ac_score = metrics.accuracy_score(label_test, pre)
+        print('k={0}: {1}'.format(k, ac_score))
+        accuracy_scores.append(score)
+        # 各経過時間を表示
+        print("経過時間:{0}".format(elapsed_time))
+    # 使う近傍数ごとの正解率を折れ線グラフ
+    X = list(ks)
+    plt.plot(X, ac_score)
+    plt.xlabel('k')
+    plt.ylabel('accuracy rate')
+    plt.show()
+```
 ###試したこと
 mnistのデータ
 mnist = datasets.fetch_mldata('MNIST original', data_home='data/src/download/')