sklearn ランダムフォレストのclass_weightパラメーターの使い方について教えてください。
2値問題の分類予測を行いたいのですが、
2値(0,1)について、ラベル0:3800 ラベル1:114 ほどの偏りがあります。
そこで、sklearn ランダムフォレストのclass_weightを使おうと思うのですが
下記のような使い方であっておりますでしょうか。
python3
1clf = RandomForestClassifier(class_weight='balanced') 2clf.fit(X_train, Y_train) 3 4または 5 6clf = RandomForestClassifier(class_weight={1:3800/114}) 7clf.fit(X_train, Y_train)
ラベル1を3800/114倍する考えであっておりますでしょうか。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/04/12 06:40
2018/04/12 06:43
2018/04/12 12:41