特徴量選択と10分割交差検証における評価方法
データセットの数があまり多くないため,10分割交差検証を用いて評価しようと思っています.
しかし,それぞれデータセットに対して特徴量選択を行うと選択された特徴量が異なってしまいます.
この場合,選択するデータセットの数は固定するべきなのでしょうか?
・それぞれデータセットに対して特徴量選択を行うと選択された特徴量が異なってしまいます
・選択するデータセットの数は固定
どういうことでしょうか?もう少し説明お願いします。
K-分割交差検証(k-fold cross validation)では特徴量選択は行いません。入れ子構造の交差検証(nested k-fold cross validation)と勘違いされていませんか?
返信が遅れてすみません。
指摘していただいた通り、nested cross validationのことを言っていました。
この場合、特徴量選択はどのタイミングですればよろしいのでしょうか?
トレーニングデータが10分割の場合全て違う可能性があるので評価に困っています。
あなたの回答
tips
プレビュー