いつもお世話になっています。
機械学習のアルゴリズムの選定について相談させてください。
機械学習の仕組みを使って、10個程度のパラメータから、とある結果(A)の確率を予測するというシステムを検討しています。
これらのパラメータは結果(A)への影響が大きいと思われるもの、影響度が不確定なもの、ほとんど影響しないものなどが混在しています。また、結果(A)は発生する確率が非常に低い(3~5%程度)ものを予想しようとしています。
イメージとしては以下の例が近いです。
例) ある人物が翌年病気で死亡する(結果A)確率を3つパラメータから予想する
①血糖値(影響度が大きいと思われるもの)
②職業(影響度が不確定なもの)
③日経平均株価(影響度がほとんどないと思われるもの)
また、発生確率が非常に低いものを予想しようとしているため、結果Aに合致する教師データが十分に用意できていない状況です。(全体のデータ母数が3万件、結果Aが発生するデータが数十〜数百件程度)
上記のような予想をたてる場合、どのようなアルゴリズムを選定すれば良いでしょうか?また、アルゴリズム以外にも便利なAPIなどがあればご教授いただきたく存じます。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2017/06/01 08:21
2017/06/01 23:47
2017/06/02 08:37
2017/06/03 06:58
2017/06/04 10:33