参考にしたサイト(kaggle、[6]より)
上のサイトで、
次のようなデータフレームで、StandardScaler()を用いてデータを前処理しているのですが、
なぜ「transf = df.Fare.reshape(-1,1)」のdf["Fare"]の部分だけtransfに代入されているのでしょうか?
fitさせたい対象が ['Fare','Age','Name_length']なら、
transf = df[col].reshape(-1,1)とすべきではないかと思いました。
from sklearn import preprocessing for col in ['Fare','Age','Name_length']: transf = df.Fare.reshape(-1,1) scaler = preprocessing.StandardScaler().fit(transf) df[col] = scaler.transform(transf)
また、「Name_length(名前の文字数)」の特徴量は乗客の生存に関係ないと思うのですが、
これを特徴量として加える理由はなんですか?
とりあえず数値化できるものはしておいた方がいいのでしょうか?
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。