目的: scikit-learnのrandom forest classifier, RFECV, GridsearchCVを使って、特徴量選択をしたい。RFECVで特徴量が削減されるごとにGridsearchCVで最適なrandom forest classifierのパラメータを設定したい。
解決したいこと: 以下のコードを実行したが、エラーがでてしまう。コードを適切に修正したいです。
from sklearn.ensemble import RandomForestClassifier from sklearn.model_selection import GridSearchCV from sklearn.feature_selection import RFECV param_grid = {'estimator__n_estimators': [10, 20, 50, 100, 200], 'estimator__max_depth': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10], 'estimator__max_features': [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8], 'estimator__max_samples' : [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8]} estimator = RandomForestClassifier() selector = RFECV(estimator, scoring = 'f1_macro', cv = 5, step=1) clf = GridSearchCV(selector, param_grid, scoring = 'f1_macro', cv = 5) clf.fit(X, y) コード
エラー:
FitFailedWarning: Estimator fit failed. The score on this train-test partition for these parameters will be set to nan. Details:
IndexError: index 376 is out of bounds for axis 0 with size 376
あなたの回答
tips
プレビュー