現在、(機械学習のライブラリ等を用いずに)自前でロジスティック回帰を行うプログラムを作成しています。
現時点では、テストデータ(正例と負例の割合が等しい、1万件程度のデータ)に関しては、正常に動作している状態です。
ですが、最終的には正例:負例が1:100程度の不均衡データを処理したいと考えています。そこで、下記サイトを参考に予測確率を調整してみたのですが、思うように精度が出ません。
Over-/Under-samplingをして学習した2クラス分類器の予測確率を調整する式
上記以外に不均衡データを上手く扱う為の手法があれば、教えて頂きたいです。

回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/01/27 07:57
2020/01/27 08:18
2020/01/27 08:39