複数の学習器を混ぜてアンサンブル学習をする方法

kaggleとかで特徴量エンジニアリングを行うときにアンサンブル学習をするのを目にします。

このサイトの例だと、XGBoostとNeural Network、RGFをアンサンブル学習しているのですが、実際にアンサンブル学習はどうやって複数のモデルを混ぜるのでしょうか？

自分の考えですが、
・使った特徴量をそのまま、まとめて使う
・複数のモデルの保存した重みを使用する
などするのでしょうか？

疑問点として
・複数のモデルの結果の何を使用し、どのように使うか
がよくわかりません。

例えば、XGBoostとNeural Network、RGFなどのアンサンブル学習はどうやるのでしょう？具体例や、方法などをご教授いただけないでしょうか？
よろしくお願いします。

行動規範の内容に同意します

回答1件

ベストアンサー

わかりやすいのはそれぞれの分類器を学習させ、votingという方法で結果をまとめる方法です。

要するに単純な多数決です。ただし、本当にただの多数決のhard votingと、各分類器でクラスごとの予測確率を出し、それに基づいて決めるsoft votingという手法があります。

もう少し凝ったやり方としては、stackingという方法があります。これは弱分類器の予測結果を新たな特徴量として、機械学習で結果を予測するという方法です。詳細についてはちょっと説明するのが大変なので、二番目の参考リンクをご参照ください。検索でもそれなりに解説がヒットします。

単純なvotingより結果が優れる傾向があるので、kaggle等ではよく使われていると思います。

投稿2018/09/30 01:23

総合スコア30933

2018/09/30 01:29

わかりやすい回答ありがとうございました

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.49%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問