Pythonにて下記のコードでアンダーサンプリングを実行しました。
元データの件数比はこちらです。
A群 289件
B群 304,374件
アンダーサンプリング
ライブラリのインポート
import pandas as pd
from imblearn.under_sampling import RandomUnderSampler
サンプリング
rs=RandomUnderSampler(random_state=42)
df_sample,_=rs.fit_resample(df,df.A)
A群 289件
B群 289件
1:1 ではなく1:2 に変更できる?
289 : 289 を 289: 578
にすることはできますか?
テストデータで予測精度が上がらず、サンプリングの時点で検討してようと思っています。
宜しくお願い致します。
あなたの回答
tips
プレビュー