質問するログイン新規登録

回答編集履歴

2

 

2023/08/10 19:06

投稿

退会済みユーザー
answer CHANGED
@@ -3,4 +3,8 @@
3
3
  - 割り振られたカテゴリのデータ数の比率をチェックしたり(例えば、質問のようにゼロ個は不適切)
4
4
  のような感じで確認処理をして、ダメならもう一度train / test splitをやり直す
5
5
 
6
- というように、**while文の内側**にtrain / test splitを入れると良いです。
6
+ というように、**while文の内側**にtrain / test splitを入れると良いです。
7
+
8
+ —-
9
+ Train/ Testからやり直せないのであれば、同じくユニークなラベルを取り出して、学習と評価とで合致しないラベルはdropするのが良いと思います。
10
+ ※ただ、これではデータ欠損が起きるので、望ましくはデータを増やして補う、なのは言うまでもない策ですね。

1

 

2023/08/10 19:03

投稿

退会済みユーザー
answer CHANGED
@@ -3,4 +3,4 @@
3
3
  - 割り振られたカテゴリのデータ数の比率をチェックしたり(例えば、質問のようにゼロ個は不適切)
4
4
  のような感じで確認処理をして、ダメならもう一度train / test splitをやり直す
5
5
 
6
- というように、**while文の内側**train / test splitを入れると良いです。
6
+ というように、**while文の内側**train / test splitを入れると良いです。