質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Q&A

0回答

498閲覧

機械学習のアンサンブル学習に関して,多数決の票数を示す指標はありますか?

man_

総合スコア45

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

0グッド

1クリップ

投稿2021/09/30 07:41

#知りたいこと
機械学習のランダムフォレストの分類について学んでいました。
ランダムフォレストはアンサンブル学習と言って,複数の決定木の出力から,多数決で分類器全体の出力を決定します。

そこで,私が気になった点として,多数決の票数によって分類器全体の出力の信頼性?が変わるのではないかと思いました。
例として,決定木10本で2値分類を行った場合,10本全てがTrueと出力する結果と,7本がTrueで3本がFalseを出力した結果では,両方とも多数決によってTrueとなりますが,10本とも全てTrueの方が正解データと一致しやすいのではないかと思いました。

そこで,これらの多数決の票数や,票数の割合を示す指標や専門用語などはありますでしょうか?
有識者の方々,ご教授のほどよろしくお願いします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2021/09/30 11:03

> 例として,決定木10本で2値分類を行った場合 具体的なコードを示すことは可能ですか?
man_

2021/09/30 11:36

プログラムはありません。 アンサンブル学習の理論的な話で、票数や票数の割合を表す指標が無いか調査していました。
meg_

2021/09/30 12:17

> 10本とも全てTrueの方が正解データと一致しやすいのではないかと思いました。 "10本とも全てTrue"とはどのような状況で起きるのでしょうか?特徴量が極端に少ない場合でしょうか??
man_

2021/09/30 12:35

>特徴量が極端に少ない場合でしょうか?? 特徴量が極端に少ない場合に起きるかは分かりません。 だた、アンサンブル学習で多数決で出力を決める場合に、票数の内訳が6対4や7対3、8対2,9対1、10対0など、入力するデータによって結果が変わってくると思います。 そこで、票数や票数の割合に関する議論がされていないか質問しました。
toast-uz

2021/10/02 01:59 編集

直接の回答(多数決の票数を示すもの)ではありませんが、バイアス、バリアンスが、質問者様の求める「指標」として適切かと思います。以下ご参考です。 https://agency-star.co.jp/public/column/ensemble-learning アンサンブル学習はバイアスを抑えて精度を上げます。しかしながら、その分学習回数が多くなるのでバリアンスが高くなり過ぎるという面があります。バイアスを抑えることも重要ですが、今度はバリアンスを上げすぎないようにバランスをとらなければなりません。そのバランスの度合いが難しいのがアンサンブル学習です。
man_

2021/10/04 03:42

toastさんありがとうございます。 調べてみたいと思います。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問