入力特徴量を削減したくborutaを使おうとしているのですがエラーが出ます
よく分からないので助けてください。お願いします。
python
1x_train=df_f.values 2t_train=df_rslt.values 3 4random_forest = RandomForestRegressor() 5 6feat_selector = BorutaPy(random_forest, n_estimators='auto') 7#特徴量選択 8feat_selector.fit(x_train, t_train) 9mask = feat_selector.support_ 10 11pd.to_pickle(mask, "select_mask.pkl")#保存 12 13print(mask) 14train_selected_x = df_f.iloc[:,mask].values
エラー内容
Traceback (most recent call last):
File "select_feature.py", line 217, in <module>
feat_selector.fit(x_train, t_train)
File "/Users/KO/opt/anaconda3/lib/python3.7/site-packages/boruta/boruta_py.py", line 201, in fit
return self._fit(X, y)
File "/Users/KO/opt/anaconda3/lib/python3.7/site-packages/boruta/boruta_py.py", line 251, in _fit
self._check_params(X, y)
File "/Users/KO/opt/anaconda3/lib/python3.7/site-packages/boruta/boruta_py.py", line 517, in _check_params
X, y = check_X_y(X, y)
File "/Users/KO/opt/anaconda3/lib/python3.7/site-packages/sklearn/utils/validation.py", line 724, in check_X_y
y = column_or_1d(y, warn=True)
File "/Users/KO/opt/anaconda3/lib/python3.7/site-packages/sklearn/utils/validation.py", line 760, in column_or_1d
raise ValueError("bad input shape {0}".format(shape))
ValueError: bad input shape (79083, 15)
上記のようなエラーが出ていて、(79083, 15)は教師データの形で確認しました.
15通りの回帰です
python
1rf_before = RandomForestRegressor() 2 3# 実行!! 4rf_before.fit(x_train, t_train) 5
borutaとは関係のなく上記のようにRandomForestRegressorのみでこの入力データを使って回帰させるとエラーなく動きます。
borutaは多目的変数の回帰はできない感じですか?
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/05/01 07:53