前提
現在、不均衡データをランダムフォレストを用いて2クラス分類しようとしています。
不均衡データの対処法に重みづけやオーバーサンプリングなどがあり、効果の検証は終わっています。
わからないこと
検証の手法と結果について第三者に説明する必要があるのですが、重みづけがアルゴリズムにどのように組み込まれているのかわかりません。
試したこと
scikit-learnの公式ドキュメントやソースコードを見たり他の方の説明を見たりしました。
重みづけのやり方については書いてあっても、具体的な処理には触れられていませんでした。
補足情報(FW/ツールのバージョンなど)
モジュール:scikit-learn
ランダムフォレスト:sklearn.ensemble.RandomForestClassifier
「重みづけがアルゴリズムにどのように組み込まれているのかわかりません」の状態で
「効果の検証は終わっています」と言えるのでしょうか。
具体的に何を実施して、どこまで分かっていて、どこからが分からないのか
を示していただかないと回答しにくいです。
あなたの回答
tips
プレビュー