質問編集履歴
1
書式の改善
title
CHANGED
File without changes
|
body
CHANGED
@@ -1,9 +1,14 @@
|
|
1
1
|
機械学習でおなじみの交差検証(クロスバリデーション)についてです。
|
2
|
-
初心者なので、見当違いなことを聞いてしまっているかもしれません
|
2
|
+
初心者なので、見当違いなことを聞いてしまっているかもしれません。
|
3
3
|
|
4
|
+
①事前にデータを分割するべきではないのか?
|
4
5
|
基本的に機械学習では、データをトレーニングデータとテストデータに分割するものだと考えているのですが、本やWebサイトに描かれている交差検証の解説では、その分割が行われていません。これは、内部で勝手に分割してくれているからだと考えているのですが、厳密にテストデータと分けて学習させるべきではないのでしょうか?
|
5
6
|
|
7
|
+
②分割した際のテストデータをどのように扱うのか?
|
6
8
|
また、交差検証では、平均などを用いて最終的なスコアなどを出すかと思いますが、モデルに直接fitさせているわけではないので、もし、交差検証を行う前にトレーニングデータとテストデータに分割させた場合、どのようにテストデータにモデルを適応させれば良いのでしょうか。
|
7
9
|
|
10
|
+
「トレーニングデータに対して交差検証→テストデータに適応」 という考え方がそもそも間違っているのでしょうか?
|
11
|
+
|
12
|
+
|
8
13
|
すごくわかりにくい書き方になってしまいました。
|
9
14
|
今、機械学習での予測モデルを構築していて、新規で入ってくるデータに対しても、そのモデルを用いて予測をしたいと考えています。学習サンプル数が非常に少ないので交差検証を試したいのですが、どのように適用させればいいかで悩んでいるという背景です。
|