実現したいこと
機械学習のデータ分割方法を理解する。
試したこと
機械学習の勉強をしているのですが、モデルの学習を行うためにデータ分割を行う場合は
訓練用・検証用・評価用に3分割するという認識でした。
訓練用:学習時に重みの更新
検証用:ハイパーパラメータのチューニング
評価用:モデルの精度評価
私自身もそのようにしていたのですが、ネットで解説記事を見ていると、データを3分割せずに、
2分割している記事がありました。
データを3分割したり、2分割する場合の違いを教えていただけないでしょうか。
(理由・使い分けの基準など)
備考
言語:Python
追記
大変失礼いたしました。ご指摘いただいた通り参考にしたサイトのリンクを載せます。
データを訓練用・検証用・評価用に分けるという内容について参考にしたサイト
https://nisshingeppo.com/ai/data-split/
学習データとテストデータに分割する(2分割している)サイト
(データ準備の箇所で分割)
https://datawokagaku.com/lightgbm/#i-3
学習データ=訓練データ
評価データ=テストデータ
のような認識をしております。

回答3件
あなたの回答
tips
プレビュー