🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
scikit-learn

scikit-learnは、Pythonで使用できるオープンソースプロジェクトの機械学習用ライブラリです。多くの機械学習アルゴリズムが実装されていますが、どのアルゴリズムも同じような書き方で利用できます。

Q&A

解決済

1回答

814閲覧

ランダムフォレストのブートストラップについて

penhakennyori

総合スコア19

scikit-learn

scikit-learnは、Pythonで使用できるオープンソースプロジェクトの機械学習用ライブラリです。多くの機械学習アルゴリズムが実装されていますが、どのアルゴリズムも同じような書き方で利用できます。

0グッド

0クリップ

投稿2021/01/25 00:21

ランダムフォレストの**「ブートストラップ」の語源**について教えてください。

私のブートストラップのイメージは、**「システムの初期化」「初期化時のOSの読込」「初期化時のハードの初期値設定」**といった
イメージです。
ランダムフォレストの「ブートストラップ」には、初期化のようなイメージはあるように思えません。
皆様、どのように解釈されているのでしょうか?
初期化のイメージを持つのは私だけでしょうか?
あいまいな質問で申し訳ありません。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

コンピュータ用語ではなくて、統計学分野の「ブートストラップ法」という言葉に由来しています。

ブートストラップ法 - Wikipedia

で、ランダムフォレストの場合はそのうちの一種の「ブートストラップ・サンプリング」を用います。別名「バギング」。

バギング - Wikipedia

基本的にこの辺のキーワードで検索するとか関連書籍を探していただければ、どういうものなのかはわかるかと思います。


ブートストラップという言葉そのものは、まあ靴紐引っ張って宙に浮くというジョークですね。

コンピュータの起動がブート(ストラップ)と言われるのは、コンピュータを起動するとき、「CPUを働かせてメモリにプログラムをロードする作業を最初に行わないといけないが、起動した直後はそれをやらせるためのプログラムがメモリ上にない」的な状況を面白がって(?)そう呼ぶことにした人が、どこかにいたからでしょう。現実には、たとえばCPUに内蔵したROMをメモリ空間にマッピングしておいて、起動直後はその番地から実行する……とかやるだけなので、大して夢のない話です。

統計のブートストラップ法は、そっちとはぜんぜん関係なくて、限られた標本から母集団を近似的に復元するやり方です。ランダムフォレストだったら、たとえばデータが200サンプルしかなくて本当だったらデータ不足です……ということになってしまったときに、サンプル数200の重複ありのランダムサンプリングを100回やって、100本の決定木を学習。するとちょっとずつ違う決定木が100本作られ、それらを使って予測して多数決するとまあまあ良い結果が得られる……という仕組み。
(ランダムフォレストはさらに特徴量のランダム選択と組み合わせますが)

投稿2021/01/27 12:57

hayataka2049

総合スコア30935

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問