scikit-learnのSVMで2値分類モデルを作っている最中です。
結果ラベルは0,1の2値なのですが、0と1の割合が2:8くらいで、そのまま学習させると0の再現率が非常に低くなるため、オーバーサンプリングしています。
オーバーサンプリングには、imblearnのSMOTEを使っています。0と1の比率を1:1になるまでオーバーサンプリングさせました。
結果、学習の精度、0の再現率、1の再現率とも満足いく結果(80~90%)になりました。
しかし、この学習済みモデルを保存して、他のデータを予測させると、なぜか0を判定できません。(0の再現率が0%になる)
そこで質問なのですが、このようにオーバーサンプリングした学習済みモデルを使って他のデータを予測させる場合、なにか注意すべき点があるのでしょうか?
0の再現率が異常に低くなる原因がわからず困っています。
ご助言いただければ幸いです。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/06/22 08:50
2020/06/22 09:05