分からないこと: 特徴量選択後最適な特徴量数を選ぶ方法が分からない。
例えば、3 classの分類モデルをrandom forestで作成したとします。
cross validationでパラメータチューニング後、test setのF1-score ( 3 classの平均 ) が100特徴量使用時に0.800、50特徴量使用時に0.820、10特徴量使用時に0.815のときに、50特徴量が最適な特徴量数である考えてよいのでしょうか。
また、統計手法で各モデルの性能に差がないかどうか検証することや、特徴量が少ないモデルの有意性を示す指標があるでしょうか。
( 3 classの予測精度に差はなく、各classの重要性は同一であるとします。 )
場合によると思います。精度以外の指標も考慮されるべきかと思います。
コメントありがとうございます。
回答1件
あなたの回答
tips
プレビュー