#XGBoostの各データの割合はどの程度にするのが一般的になりますか?
先日運用パラメータの選定でtrain/validation/test用いて検証すると良いとのアドバイスを頂きまして試そうと考えています。
現状は以下の様な割合で考えています。
- train 80%
- validation 10%
- test 10%
##併せて学習した結果の受け取り方としてはvalidationとtestデータの正解率をどの様に考えると良いでしょうか?
結果例 1
validation 正解率60%
test 正解率60%
結果例 2
validation 正解率70%
test 正解率50%
結果例 3
validation 正解率50%
test 正解率70%
上記の様な結果例の場合、正解率の差が小さい方(結果例1)が良いと考えているのですがあっていますか?
validationとtestの差が大きい場合はどの様に調整すると良いでしょうか?
▼環境など
Windows 10
python 3.7
機械学習 XGBoost
パラメータの調整にoptunaを利用しています。
回答1件
あなたの回答
tips
プレビュー