y_pred_ols とy_pred_ridgeは何の値なのか

y_pred_ols とy_pred_ridgeは何の値なのでしょうか？

from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LinearRegression, Ridge
from sklearn.pipeline import Pipeline
from sklearn.metrics import r2_score
import pandas as pd
from sklearn.datasets import load_boston

dataset = load_boston()

X = pd.DataFrame(dataset.data, columns=dataset.feature_names)
y = pd.DataFrame(dataset.target, columns=['y'])

pipe_ols = Pipeline([('scl',  StandardScaler()), ('est', LinearRegression())])
pipe_ridge = Pipeline([('scl', StandardScaler()), ('est', Ridge())])

pipe_ols.fit(X, y.as_matrix().ravel())
pipe_ridge.fit(X, y.as_matrix().ravel())

y_true = y.as_matrix().ravel()
y_pred_ols = pipe_ols.predict(X)
y_pred_ridge = pipe_ridge.predict(X)

というコードがありました。
この、

y_pred_ols = pipe_ols.predict(X)
y_pred_ridge = pipe_ridge.predict(X)

が何しているのかわかりません。

pipe_ols.fit(X, y.as_matrix().ravel())
pipe_ridge.fit(X, y.as_matrix().ravel())

で学習したものに対して、

y_pred_ols = pipe_ols.predict(X)
y_pred_ridge = pipe_ridge.predict(X)

で予想しているのですが、
引数がXの学習データのみを持っていてyのテストデータを入れていないのになぜ分類ができるのかがわかりません。なぜXの学習データだけで予測ができるのでしょうか？

行動規範の内容に同意します

回答1件

ベストアンサー

Xの入力に対してyを予測したいのではないのですか。
yがないとyが予測できないのでは目的が果たせません。

投稿2017/12/11 13:59

mkgrei

総合スコア8560

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

y_pred_ols とy_pred_ridgeは何の値なのか

関連した質問