データセットがそれほど大きくないときに(~300 samples)あるモデルのパラメータを調節し、さらにそのモデルの汎化性能を知りたい際には、一般的にNested cross validationが推奨されていると思います。
ただ、nested CV の内側のループで調節されたパラメータの組がk(k for outer loop k-fold)得られると思います。
このような場合、実際に汎化性能を推定する際にはどのパラメータをもちいたらよいのでしょうか?
一つ考えたのは、k-fold CV の平均スコアによってパラメータを最適化することですが、これだと結局汎化性能の評価に使いたいデータが入ったデータを用いてパラメータを最適化してしまっており、多少なりともleakが生じているので、nested CVの意味があまりないのではと感じます。
どのような方法が考えられるのでしょうか?よろしくお願いします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。