質問編集履歴

1

質問内容の追記

2020/10/03 13:30

投稿

退会済みユーザー
test CHANGED
File without changes
test CHANGED
@@ -5,3 +5,17 @@
5
5
  では、nested cross validationでは、どのように特徴量を選択すればよいでしょうか。
6
6
 
7
7
  全データを使って特徴量選択を行い、その後にnested cross validationを行えばよいのでしょうか。
8
+
9
+
10
+
11
+ 追記:
12
+
13
+ 特徴量選択時、情報のリークを避けるため、データをtrainとtestに分割し、trainで特徴量選択を行うに対し、
14
+
15
+ nested cross validationではどうすればよいか、という質問です。
16
+
17
+ 例えば、outer loopが5-foldである時、trainとtestの各組で特徴長選択を行うべきでしょうか。
18
+
19
+ ( 5回繰り返すのでしょうか。 )
20
+
21
+ それとも、全データで特徴量選択を行い、その後にnested cross validationで性能評価を行えばよいでしょうか。