teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

2

補足、表現の変更

2021/10/22 04:10

投稿

matsu1007
matsu1007

スコア1

title CHANGED
File without changes
body CHANGED
@@ -2,8 +2,8 @@
2
2
 
3
3
  不均衡データで学習(モデル作成)を行う際に、学習データのオーバーサンプリングやアンダーサンプリングが有効であることは理解できました。
4
4
 
5
- 一方で、**オーバーサンプリングやアンダーサンプリングにより作成したモデルに対して、検証・テスト・予測(推論)を行う際には、検証データやテストデータはサンプリングせずに本来の正例・負例比率のまま投入することになる**かと考えています。
5
+ 一方で、**オーバーサンプリングやアンダーサンプリングにより作成したモデルに対して、検証・テスト・予測(推論)を行う際には、検証テスト・予測(推論)データはサンプリングせずに本来の正例・負例比率のまま投入することになる**かと考えています。
6
- (検証データやテストデータは学習データ同様、正例・負例の答えが分かっているので、やろうと思えばサンプリングは可能だと思いますが、予測用のデータは当然、事前に正例・負例は分からないのでサンプリングはできないため
6
+ (検証データやテストデータは学習データ同様、正例・負例の答えが分かっているので、やろうと思えばサンプリングは可能だと思いますが、予測用のデータは当然、事前に正例・負例は分からないのでサンプリングはできないですし、検証やテストでもオーバーサンプリングやアンダーサンプリングを行ってしまうことは目的と異なる気がします。
7
7
 
8
8
  この場合、**学習時と検証・テスト・予測(推論)時で、正例・負例比率が異なりますが、検証・テスト・予測(推論)としては、サンプリングせずにそのまま投入することは特に問題ないのでしょうか?**
9
9
 

1

表現の修正

2021/10/22 04:10

投稿

matsu1007
matsu1007

スコア1

title CHANGED
File without changes
body CHANGED
@@ -2,12 +2,12 @@
2
2
 
3
3
  不均衡データで学習(モデル作成)を行う際に、学習データのオーバーサンプリングやアンダーサンプリングが有効であることは理解できました。
4
4
 
5
- 一方で、**オーバーサンプリングやアンダーサンプリングにより作成したモデルに対して、検証テストを行う際には、検証データやテストデータはサンプリングせずに本来の正例・負例比率のまま投入することになる**かと考えています。
5
+ 一方で、**オーバーサンプリングやアンダーサンプリングにより作成したモデルに対して、検証テスト・予測(推論)を行う際には、検証データやテストデータはサンプリングせずに本来の正例・負例比率のまま投入することになる**かと考えています。
6
- (検証データは学習データ同様、正例・負例の答えが分かっているので、やろうと思えばサンプリングは可能だと思いますが、テストデータは当然、事前に正例・負例は分からないのでサンプリングはできないため)
6
+ (検証データやテストデータは学習データ同様、正例・負例の答えが分かっているので、やろうと思えばサンプリングは可能だと思いますが、予測用のデータは当然、事前に正例・負例は分からないのでサンプリングはできないため)
7
7
 
8
- この場合、**学習時と検証・テスト時で、正例・負例比率が異なりますが、検証テストとしては、サンプリングせずにそのまま投入することは特に問題ないのでしょうか?**
8
+ この場合、**学習時と検証・テスト・予測(推論)時で、正例・負例比率が異なりますが、検証テスト・予測(推論)としては、サンプリングせずにそのまま投入することは特に問題ないのでしょうか?**
9
9
 
10
- また**問題があるとしたら、検証データやテストデータの扱いやテスト結果の扱いに対して、どのような対策が有効でしょうか?**
10
+ また**問題があるとしたら、検証テスト・予測(推論)データの扱いや結果の扱いに対して、どのような対策が有効でしょうか?**
11
11
 
12
12
  ご教授頂けますと幸いです。
13
13