現在こちらの書籍を読みながら機械学習の勉強を進めています
Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎
その中でランダムフォレストにおける内容について分からない部分があります。
少しづつ異なった複数の決定木を作成するために、ブートストラップサンプリングを行い少しずつ異なったデータセットを作成する、という部分は何となくわかりました。
その次に重要なパラメータとして「max_features」というものが挙げられていました。
パラメータの説明について以下のように書かれていました
決定木を作るアルゴリズムを少しだけ変更する。 個々のノードで最適なテストを選ぶのではなく、特徴量のサブセットをランダムに選び、 その特徴量を使うものの中から最適なテストを選ぶ。特徴量のサブセットの大きさは、 パラメータmax_featuresで制御できる。 この特徴量のサブセットの選択は個々のノードで独立に繰り返し行われる。 これにより決定木の個々のノードが異なる特徴量のサブセットを使て決定を行うようになる。
この説明を読んでも意味が分からず何が重要なのかが分からず悩んでいます
このパラメータが何を意図しているのかを教えて頂きたいです
初歩的な内容ですが宜しくお願い致します
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/07/12 02:36
2018/07/12 10:42 編集
2018/07/13 01:57 編集
2018/07/17 01:50