質問編集履歴
2
補足、表現の変更
title
CHANGED
File without changes
|
body
CHANGED
@@ -2,8 +2,8 @@
|
|
2
2
|
|
3
3
|
不均衡データで学習(モデル作成)を行う際に、学習データのオーバーサンプリングやアンダーサンプリングが有効であることは理解できました。
|
4
4
|
|
5
|
-
一方で、**オーバーサンプリングやアンダーサンプリングにより作成したモデルに対して、検証・テスト・予測(推論)を行う際には、検証
|
5
|
+
一方で、**オーバーサンプリングやアンダーサンプリングにより作成したモデルに対して、検証・テスト・予測(推論)を行う際には、検証・テスト・予測(推論)データはサンプリングせずに本来の正例・負例比率のまま投入することになる**かと考えています。
|
6
|
-
(検証データやテストデータは学習データ同様、正例・負例の答えが分かっているので、やろうと思えばサンプリングは可能だと思いますが、予測用のデータは当然、事前に正例・負例は分からないのでサンプリングはできない
|
6
|
+
(検証データやテストデータは学習データ同様、正例・負例の答えが分かっているので、やろうと思えばサンプリングは可能だと思いますが、予測用のデータは当然、事前に正例・負例は分からないのでサンプリングはできないですし、検証やテストでもオーバーサンプリングやアンダーサンプリングを行ってしまうことは目的と異なる気がします。)
|
7
7
|
|
8
8
|
この場合、**学習時と検証・テスト・予測(推論)時で、正例・負例比率が異なりますが、検証・テスト・予測(推論)としては、サンプリングせずにそのまま投入することは特に問題ないのでしょうか?**
|
9
9
|
|
1
表現の修正
title
CHANGED
File without changes
|
body
CHANGED
@@ -2,12 +2,12 @@
|
|
2
2
|
|
3
3
|
不均衡データで学習(モデル作成)を行う際に、学習データのオーバーサンプリングやアンダーサンプリングが有効であることは理解できました。
|
4
4
|
|
5
|
-
一方で、**オーバーサンプリングやアンダーサンプリングにより作成したモデルに対して、検証
|
5
|
+
一方で、**オーバーサンプリングやアンダーサンプリングにより作成したモデルに対して、検証・テスト・予測(推論)を行う際には、検証データやテストデータはサンプリングせずに本来の正例・負例比率のまま投入することになる**かと考えています。
|
6
|
-
(検証データは学習データ同様、正例・負例の答えが分かっているので、やろうと思えばサンプリングは可能だと思いますが、
|
6
|
+
(検証データやテストデータは学習データ同様、正例・負例の答えが分かっているので、やろうと思えばサンプリングは可能だと思いますが、予測用のデータは当然、事前に正例・負例は分からないのでサンプリングはできないため)
|
7
7
|
|
8
|
-
この場合、**学習時と検証・テスト時で、正例・負例比率が異なりますが、検証
|
8
|
+
この場合、**学習時と検証・テスト・予測(推論)時で、正例・負例比率が異なりますが、検証・テスト・予測(推論)としては、サンプリングせずにそのまま投入することは特に問題ないのでしょうか?**
|
9
9
|
|
10
|
-
また**問題があるとしたら、検証
|
10
|
+
また**問題があるとしたら、検証・テスト・予測(推論)データの扱いや結果の扱いに対して、どのような対策が有効でしょうか?**
|
11
11
|
|
12
12
|
ご教授頂けますと幸いです。
|
13
13
|
|