回答編集履歴
2
answer
CHANGED
@@ -3,4 +3,8 @@
|
|
3
3
|
- 割り振られたカテゴリのデータ数の比率をチェックしたり(例えば、質問のようにゼロ個は不適切)
|
4
4
|
のような感じで確認処理をして、ダメならもう一度train / test splitをやり直す
|
5
5
|
|
6
|
-
というように、**while文の内側**にtrain / test splitを入れると良いです。
|
6
|
+
というように、**while文の内側**にtrain / test splitを入れると良いです。
|
7
|
+
|
8
|
+
—-
|
9
|
+
Train/ Testからやり直せないのであれば、同じくユニークなラベルを取り出して、学習と評価とで合致しないラベルはdropするのが良いと思います。
|
10
|
+
※ただ、これではデータ欠損が起きるので、望ましくはデータを増やして補う、なのは言うまでもない策ですね。
|
1
answer
CHANGED
@@ -3,4 +3,4 @@
|
|
3
3
|
- 割り振られたカテゴリのデータ数の比率をチェックしたり(例えば、質問のようにゼロ個は不適切)
|
4
4
|
のような感じで確認処理をして、ダメならもう一度train / test splitをやり直す
|
5
5
|
|
6
|
-
というように、**while文の内側**train / test splitを入れると良いです。
|
6
|
+
というように、**while文の内側**にtrain / test splitを入れると良いです。
|