前提・実現したいこと
pythonで機械学習をしていて標準化をしようとしています。そこで疑問に思ったのですが、データをtest用と学習用の二つに分けていてそれらを標準化しようとしたときfitに渡すデータは一つのまま標準化してmodelにデータを渡していいのでしょうか。それとも別にインスタンスを生成してそれそれで標準化した方がいいのでしょうか?
from sklearn.preprocessing import StandardScaler
scaler=StandardScaler()
scaler.fit(x_train)
x_train_std=scaler.transform(x_train)
x_test=scaler.transform(x_test)
print(x_train_std)
x_testとx_trainは分割したデータです。
試したこと
fitの部分では引数で渡したデータの平均と標準偏差が保存されているのでその値によって標準化されているということを知りました。
ここにより詳細な情報を記載してください。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2022/01/01 08:29
2022/01/01 10:41
2022/01/01 14:07