y_pred_ols とy_pred_ridgeは何の値なのでしょうか?
from sklearn.preprocessing import StandardScaler from sklearn.linear_model import LinearRegression, Ridge from sklearn.pipeline import Pipeline from sklearn.metrics import r2_score import pandas as pd from sklearn.datasets import load_boston dataset = load_boston() X = pd.DataFrame(dataset.data, columns=dataset.feature_names) y = pd.DataFrame(dataset.target, columns=['y']) pipe_ols = Pipeline([('scl', StandardScaler()), ('est', LinearRegression())]) pipe_ridge = Pipeline([('scl', StandardScaler()), ('est', Ridge())]) pipe_ols.fit(X, y.as_matrix().ravel()) pipe_ridge.fit(X, y.as_matrix().ravel()) y_true = y.as_matrix().ravel() y_pred_ols = pipe_ols.predict(X) y_pred_ridge = pipe_ridge.predict(X)
というコードがありました。
この、
y_pred_ols = pipe_ols.predict(X) y_pred_ridge = pipe_ridge.predict(X)
が何しているのかわかりません。
pipe_ols.fit(X, y.as_matrix().ravel()) pipe_ridge.fit(X, y.as_matrix().ravel())
で学習したものに対して、
y_pred_ols = pipe_ols.predict(X) y_pred_ridge = pipe_ridge.predict(X)
で予想しているのですが、
引数がXの学習データのみを持っていてyのテストデータを入れていないのになぜ分類ができるのかがわかりません。なぜXの学習データだけで予測ができるのでしょうか?
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。