teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

1

書式の改善

2020/09/30 02:21

投稿

kiyushi
kiyushi

スコア18

title CHANGED
File without changes
body CHANGED
@@ -1,9 +1,14 @@
1
1
  機械学習でおなじみの交差検証(クロスバリデーション)についてです。
2
- 初心者なので、見当違いなことを聞いてしまっているかもしれませんが、多めに見てください
2
+ 初心者なので、見当違いなことを聞いてしまっているかもしれません。
3
3
 
4
+ ①事前にデータを分割するべきではないのか?
4
5
  基本的に機械学習では、データをトレーニングデータとテストデータに分割するものだと考えているのですが、本やWebサイトに描かれている交差検証の解説では、その分割が行われていません。これは、内部で勝手に分割してくれているからだと考えているのですが、厳密にテストデータと分けて学習させるべきではないのでしょうか?
5
6
 
7
+ ②分割した際のテストデータをどのように扱うのか?
6
8
  また、交差検証では、平均などを用いて最終的なスコアなどを出すかと思いますが、モデルに直接fitさせているわけではないので、もし、交差検証を行う前にトレーニングデータとテストデータに分割させた場合、どのようにテストデータにモデルを適応させれば良いのでしょうか。
7
9
 
10
+ 「トレーニングデータに対して交差検証→テストデータに適応」 という考え方がそもそも間違っているのでしょうか?
11
+
12
+
8
13
  すごくわかりにくい書き方になってしまいました。
9
14
  今、機械学習での予測モデルを構築していて、新規で入ってくるデータに対しても、そのモデルを用いて予測をしたいと考えています。学習サンプル数が非常に少ないので交差検証を試したいのですが、どのように適用させればいいかで悩んでいるという背景です。