scikit learn の mean_square_error について理解があまりなっていないので質問します
僕が勘違いしているだけだと思うのでご指摘お願いします
例えば多項式回帰についてデータを分割した後に,
python
1poly_reg = PolynomialFeatures(degree=2) 2poly_x = poly_reg.fit_transform(x_train) 3 4clf.fit(poly_x, y_train) 5 6plt.scatter(x_train, y_train) 7plt.plot(x_train, clf.predict(poly_x)) 8
訓練データでモデルを作成するまではいいのですが
平均二乗誤差をテストデータから求める際,
python
1poly_x_test = poly_reg.fit_transform(x_test) 2#MSE 3predictive_y = clf.predict(poly_x_test) 4mse = mean_squared_error(y_test, predictive_y) 5print('MSE=', mse)
こうして平均二乗誤差を求めるとテストデータで作ったモデルからその予測値とテストデータの誤差を求めているだけのような気がするのですが、これは正しいのでしょうか
僕の理解だと平均二乗誤差は訓練データの予測値とテストデータの誤差を求めるものだと思っていたので、混乱しています
質問が分かりにくくなってしまいましたが、交差検証と平均二乗誤差を算出するこのやり方が正しいのか、(間違っていたら指摘お願いします)
合っているなら、多分scikit learn の動きか平均二乗誤差の意義をを勘違いしてると思うので、解説お願いしたいです
よろしくお願いします
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。