RandomForestClassifier(n_estimators= 1000)による二値分類に取り組んでいます。
特徴量は250程度です。
max_depth=Noneで行ったところ、トレーニングでの正解率が1.0、テストが0.65ほどになりました。
過学習と判断し、max=depthを下げていきましたが、max_depth=5でもトレーニング正解率が0.8ほどに下がり、テスト正解率も上がるどころか、0.62に下がっていしまいした。
どのような原因が可能性として考えられるのでしょうか?
ランダムフォレストはかなり過学習しにくいということなのですが。
回答1件
あなたの回答
tips
プレビュー