不均衡なデータを under samplingする方法を知りたいです。
train.vlue_counts[4]のデータの個数が非常に多かったので、
train.vlue_counts[1]の個数と同じにしようと思い、下のコードを書きました。
from imblearn.under_sampling import RandomUnderSampler
rank_1 = Y_train.value_counts()[1]
rank_2 = Y_train.value_counts()[2]
rank_3 = Y_train.value_counts()[3]
rus = RandomUnderSampler(ratio={1:rank_1, 2:rank_2, 3:rank_3, 4:rank_1}, random_state=71)
X_train_rus, Y_train_rus = rus.fit_sample(X_train,Y_train)
しかし、次のようなエラーが出ました。
TypeError: init() got an unexpected keyword argument 'ratio'
どのようにtrain.vlue_counts[4]のデータの個数を減らせばよいでしょうか?
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/07/20 03:43
2020/07/20 12:12