回答率: 85.30%

質問するログイン新規登録

トップ機械学習に関する質問

Q&A

解決済

2回答

2602閲覧

k分割交差検証について

総合スコア11

0グッド

1クリップ

投稿2018/07/27 11:09

0

1

交差検証について質問です。
k分割交差検証ではトレーニングデータをk分割して。。。という手法ですが、
その際に検証データはそのトレーニングデータに含まれていないといけないのでしょうか？
もしそうであれば未知のものを予測する際は交差検証は不要ということなのでしょうか？
参考書を見たり、人に聞いたりしていくうちに訳がわからなくなりました。
解答お願い致します。

また、参考になるサイトがあれば、教えてくだされば幸いです。
拙い文ですが宜しくお願いします。

行動規範の内容に同意します

回答2件

0

ベストアンサー

交差検証は、学習データと評価データに分ける方法の上位互換みたいなものです。ちなみに単純に分ける方法はホールドアウト検証と呼びます。

トレーニングデータをk分割して。。。という手法

ではないです。データを持っているなら、学習データと評価データに分けたりはせず、丸ごと交差検証に入れて良いのです。

もしそうであれば未知のものを予測する際は交差検証は不要ということなのでしょうか？

本当に未知のものは、単純にモデルを使って予測するだけです。

なんでホールドアウト検証や交差検証をやるのかというと、未知のデータを入れて「どれくらいの性能になるか」を手持ちの既知のデータで見積もっておく必要があるからです。

そのために、データを学習用と評価用に分けて、評価用はモデルにとっては未知のデータになるように扱うという手続きを踏みます。交差検証も、やっていることはけっきょくそれです。

交差検証の特徴的な利点は

手持ちデータすべてを予測している
k回やって結果を平均する

の2つで、どちらも評価指標の分布の分散が小さくなる方向に働きます。誤差の少ない見積もりが得られるということです。

参考になりそうなサイトは、

「そのモデルの精度、高過ぎませんか？」過学習・汎化性能・交差検証のはなし - 六本木で働くデータサイエンティストのブログ

を読んでおくといいでしょう。

また、

交差検証 - Wikipedia

も簡潔ながらよくまとまっています。ちゃんとした説明と併読するといいでしょう。

投稿2018/07/27 14:57

総合スコア30939

2018/07/27 15:14

ありがとうございます。丁寧ですごくわかりやすかったです。すごくスッキリしました。

行動規範の内容に同意します

0

https://mathwords.net/kousakakunin

？
これだけは覚えていれば応用が効くと思います。
交差検定をしていないモデルはただのゴミです。

機械学習の手法はその性質上、過学習する宿命にあります。

それぞれのモデルの信頼性がどれほどのものなのか、確かめるためのものが交差検定です。

投稿2018/07/27 12:36

総合スコア8562

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.30%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問

トップ機械学習に関する質問

k分割交差検証について