連投申し訳ありません。ランダムフォレストについての質問を書き直させて質問させて頂きました。
現在私は引継ぎである深層学習のモデルを使用しているのですが、そのモデルは18項目(a~s)のデータを学習させ、aを導出するモデルです。
このモデルではデータ入力の前に特徴量選択を行い入力項目数を減らすのですが、
この際ランダムフォレストによる特徴量選択を使用しています。
この時に特徴量選択がどのように行われているのか、が理解できませんでした。
私のイメージではターゲットであるaを縦軸に、その他bsを横軸に全てのデータを表示し、sをランダムに選択しテスト(ノード)を作成。これをこちらが設定した深さまで行い、特徴量(b~s)の重要度を決定する。以上の作業を複数回行い、多数決で特徴量の重要度を決定、設定した特徴量の数まで重要度の低い特徴量を削る。
そこからaの回帰タスクとして各テストでb
という作業が行われているという認識なのですが、これは正しいでしょうか。
度々申し訳ありませんが、よろしくお願いします。
回答1件
あなたの回答
tips
プレビュー