コンピュータ用語ではなくて、統計学分野の「ブートストラップ法」という言葉に由来しています。
ブートストラップ法 - Wikipedia
で、ランダムフォレストの場合はそのうちの一種の「ブートストラップ・サンプリング」を用います。別名「バギング」。
バギング - Wikipedia
基本的にこの辺のキーワードで検索するとか関連書籍を探していただければ、どういうものなのかはわかるかと思います。
ブートストラップという言葉そのものは、まあ靴紐引っ張って宙に浮くというジョークですね。
コンピュータの起動がブート(ストラップ)と言われるのは、コンピュータを起動するとき、「CPUを働かせてメモリにプログラムをロードする作業を最初に行わないといけないが、起動した直後はそれをやらせるためのプログラムがメモリ上にない」的な状況を面白がって(?)そう呼ぶことにした人が、どこかにいたからでしょう。現実には、たとえばCPUに内蔵したROMをメモリ空間にマッピングしておいて、起動直後はその番地から実行する……とかやるだけなので、大して夢のない話です。
統計のブートストラップ法は、そっちとはぜんぜん関係なくて、限られた標本から母集団を近似的に復元するやり方です。ランダムフォレストだったら、たとえばデータが200サンプルしかなくて本当だったらデータ不足です……ということになってしまったときに、サンプル数200の重複ありのランダムサンプリングを100回やって、100本の決定木を学習。するとちょっとずつ違う決定木が100本作られ、それらを使って予測して多数決するとまあまあ良い結果が得られる……という仕組み。
(ランダムフォレストはさらに特徴量のランダム選択と組み合わせますが)
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。