質問編集履歴

誤字

2020/10/31 08:08

投稿

スコア2

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -2,7 +2,7 @@
 scikit-learnのSVMで２値分類モデルを作っています。データの数は150程度です。
 識別するラベルは0,1の２値なのですが、0の割合が80%とか偏っており、データの数が少ないためオーバーサンプリング(SMOTE)することを考えています。
-ネットの記事やブログを探してみたのですが
+ネットの記事やブログを探したところ、
 学習データをオーバーサンプリングしている例はよく見るのですが、
 検証用データやテストデータをオーバーサンプリングする例はあまり見ません。

文法の訂正

2020/10/31 08:08

投稿

スコア2

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -9,4 +9,6 @@
 Q1.検証用データ・テストデータをオーバーサンプリングすることはタブーなのでしょうか？
 Q2.学習データとテストデータのラベルの比率の違いは事前確率に影響を与えると思うのですが、
-比率を合わせなかったときに出てくる問題にはどのようなものがありますか？
+比率を合わせなかったときに出てくる問題にはどのようなものがありますか？
+よろしくお願いします。