編集履歴

質問編集履歴

ソースコードの編集

2018/01/22 12:49

投稿

takahiro_tt

スコア9

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -10,7 +10,7 @@
 ---追記
-こちらのエラーは解決しましたが、進めていくうちに次のエラーが発生しました
+上記のエラーは解決しましたが、進めていくうちに次のエラーが発生しました
 「SGDの平均2乗誤差」と「SVRの平均二乗誤差」
@@ -27,6 +27,8 @@
 ###該当のソースコード
+```ここに言語を入力
  -*- coding: utf-8 -*-
@@ -58,7 +60,7 @@
-"#3：データの整形-------------------------------------------------------
+#3：データの整形-------------------------------------------------------
 sc=preprocessing.StandardScaler()
@@ -72,13 +74,13 @@
-"#4：学習データとテストデータに分割する-------------------------------
+#4：学習データとテストデータに分割する-------------------------------
 X_rm_train, X_rm_test, Y_train, Y_test = model_selection.train_test_split(X_rm, Y, test_size=0.5, random_state=0)
-" 5：SGD Regressorを適用する-------------------------------------------
+#5：SGD Regressorを適用する-------------------------------------------
 clf_rm = linear_model.SGDRegressor(max_iter=1000)
@@ -86,7 +88,7 @@
-" 解説6：SVR linear Regressorを適用する-------------------------------------------
+#解説6：SVR linear Regressorを適用する-------------------------------------------
 clf_svr = svm.SVR(kernel='linear', C=1e3, epsilon=2.0)
@@ -94,7 +96,7 @@
-" #7：結果をプロットする------------------------------------------------
+#7：結果をプロットする------------------------------------------------
@@ -118,7 +120,7 @@
-"# 8：誤差-------------------------------------------------
+# 8：誤差-------------------------------------------------
 Y_pred_sgd=clf_rm.predict(X_rm_test)
@@ -134,7 +136,7 @@
 print(RMS_svr)
+```
 ###試したこと

エラー個所の更新

2018/01/22 12:49

投稿

takahiro_tt

スコア9

test CHANGED Viewed

	@@ -1 +1 @@
1	- pythonでのエラー~~が対処~~できません
1	+ scikit-learnのエラー解決できません

test CHANGED Viewed

@@ -1,6 +1,6 @@
 ###前提・実現したいこと
-http://neuro-educator.com/ml14/　のサイトを参考に自分でも回帰を実装しようと思い、プログラムを書いていたところ下記のエラーがでました。
+http://neuro-educator.com/ml18/　のサイトを参考に自分でも回帰を実装しようと思い、プログラムを書いていたところ下記のエラーがでました。
@@ -8,11 +8,27 @@
 ValueError: Found input variables with inconsistent numbers of samples: [84, 105]
+---追記
+こちらのエラーは解決しましたが、進めていくうちに次のエラーが発生しました
+「SGDの平均2乗誤差」と「SVRの平均二乗誤差」
+47.8755773832
+49.403758817
+Data with input dtype int64 was converted to float64 by StandardScaler.
+  warnings.warn(msg, DataConversionWarning)
 ###該当のソースコード
-" -*- coding: utf-8 -*-
+ -*- coding: utf-8 -*-
 import pandas as pd
@@ -20,15 +36,9 @@
 import matplotlib.pyplot as plt
-from sklearn import cross_validation, preprocessing, linear_model #機械学習用のライブラリを利用
+from sklearn import model_selection, preprocessing, linear_model ,svm#機械学習用のライブラリ
-from sklearn.externals import joblib
 from matplotlib import pyplot as plt
-from sklearn import datasets
-from sklearn import svm
@@ -48,7 +58,7 @@
-"解説 3：データの整形-------------------------------------------------------
+"#3：データの整形-------------------------------------------------------
 sc=preprocessing.StandardScaler()
@@ -62,21 +72,13 @@
-"解説 4：学習データとテストデータに分割する-------------------------------
+"#4：学習データとテストデータに分割する-------------------------------
-X_train, X_test, Y_train, Y_test = cross_validation.train_test_split(X, Y, test_size=0.2, random_state=0)
+X_rm_train, X_rm_test, Y_train, Y_test = model_selection.train_test_split(X_rm, Y, test_size=0.5, random_state=0)
-X_rm_train, X_rm_test, Y_train, Y_test = cross_validation.train_test_split(X_rm, Y, test_size=0.)
-"解説 5：SGD Regressorを適用する-------------------------------------------
+" 5：SGD Regressorを適用する-------------------------------------------
-clf = linear_model.SGDRegressor(max_iter=1000)
-clf.fit(X_train, Y_train)
 clf_rm = linear_model.SGDRegressor(max_iter=1000)
@@ -84,75 +86,65 @@
-print("全部使用したときの回帰式の係数")
+" 解説6：SVR linear Regressorを適用する-------------------------------------------
-print(clf.intercept_)
+clf_svr = svm.SVR(kernel='linear', C=1e3, epsilon=2.0)
-print(clf.coef_)
+clf_svr.fit(X_rm_train, Y_train)
-"解説 6：結果をプロットする------------------------------------------------
+" #7：結果をプロットする------------------------------------------------
-" %matplotlib inline
-line_X = np.arange(0, 250, 0.1) #・・・から。。。まで1刻み
-line_Y = clf_rm.predict(line_X[:, np.newaxis])
+line_X=np.arange(0, 250, 1) #3から10まで1刻み
+line_Y_sgd=clf_rm.predict(line_X[:, np.newaxis])
+line_Y_svr=clf_svr.predict(line_X[:, np.newaxis])
-plt.figure(figsize=(10,10))
+plt.figure(figsize=(30,30))
 plt.subplot(2, 1, 1)
 plt.scatter(X_rm_train, Y_train, c='b', marker='s')
-plt.plot(line_X, line_Y, c='r')
+plt.plot(line_X, line_Y_sgd, c='r')
+plt.plot(line_X, line_Y_svr, c='g')
 plt.show
-"解説 7：誤差をプロットする-------------------------------------------------
+"# 8：誤差-------------------------------------------------
-Y_rm_pred=clf_rm.predict(X_rm_test)
+Y_pred_sgd=clf_rm.predict(X_rm_test)
-plt.subplot(2, 1, 2)
+Y_pred_svr=clf_svr.predict(X_rm_test)
-plt.scatter(Y_test, Y_rm_pred-Y_test, c='b', marker='s', label="RM_only")
+print("\n「SGDの平均2乗誤差」と「SVRの平均二乗誤差」")
+RMS_sgd=np.mean((Y_pred_sgd - Y_test) ** 2)
+RMS_svr=np.mean((Y_pred_svr - Y_test) ** 2)
-Y_pred=clf.predict(X_test)
+print(RMS_sgd)
-plt.scatter(Y_test, Y_pred-Y_test, c='r', marker='s',label="ALL")
-plt.legend()
-plt.hlines(y=0, xmin=0, xmax=50, colors='black')
-plt.show
-print("\n「RMだけの平均2乗誤差」と「全部を使用したときの平均二乗誤差」")
-RMS=np.mean((Y_pred - Y_test) ** 2)
-RMS_rm=np.mean((Y_rm_pred - Y_test) ** 2)
-print(RMS_rm)
+print(RMS_svr)
-print(RMS)
 ###試したこと
-csvファイルの（kaozahyou3.csv）は１３行１０６列のファイルです
 いままでも小さなエラーは出ていて少しづつ解決してきたのですが、
 このエラーで詰まってしまいました。
+ネットを探しながら解決法を見つけているのですが、見つかりません。