質問編集履歴
2
誤字
title
CHANGED
File without changes
|
body
CHANGED
@@ -2,7 +2,7 @@
|
|
2
2
|
scikit-learnのSVMで2値分類モデルを作っています。データの数は150程度です。
|
3
3
|
識別するラベルは0,1の2値なのですが、0の割合が80%とか偏っており、データの数が少ないためオーバーサンプリング(SMOTE)することを考えています。
|
4
4
|
|
5
|
-
ネットの記事やブログを探し
|
5
|
+
ネットの記事やブログを探したところ、
|
6
6
|
学習データをオーバーサンプリングしている例はよく見るのですが、
|
7
7
|
検証用データやテストデータをオーバーサンプリングする例はあまり見ません。
|
8
8
|
|
1
文法の訂正
title
CHANGED
File without changes
|
body
CHANGED
@@ -9,4 +9,6 @@
|
|
9
9
|
Q1.検証用データ・テストデータをオーバーサンプリングすることはタブーなのでしょうか?
|
10
10
|
|
11
11
|
Q2.学習データとテストデータのラベルの比率の違いは事前確率に影響を与えると思うのですが、
|
12
|
-
比率を合わせなかったときに出てくる問題にはどのようなものがありますか?
|
12
|
+
比率を合わせなかったときに出てくる問題にはどのようなものがありますか?
|
13
|
+
|
14
|
+
よろしくお願いします。
|