【前提】
1.説明変数A、媒介変数B1、B2、目的変数C1、C2、C3があります
2.C1~C3はある尺度Cの下位因子です
3.尺度Cは平均値以上を高群、それ以下を低群に群分けできるものとします
構造方程式モデリングを用いて画像のようなモデルを解き、その適合度は良好だとします。
【知りたいこと】
Cの高群に特徴的なのは、B1、B2、A1のうちどれなのかを知るためにランダムフォレストを用いたとします。
目的変数にC高群、C低群
説明変数にA1、B1、B2を入れて検討するということです。
この時、ランダムフォレストを用いて検討することにどの程度意味があるのでしょうか?
というのも、ジニ係数で各変数(この場合はB1、B2、A1)の重要度は算出できるので一定の意味はあると思うのですが、
⓵性能評価の数値について:例えば、OOBが学習データ29%、テストデータ32%だった場合、この数値をどう評価してよいかわかりません。OOBは交差検証による性能評価を行った結果得られる誤答率だと解釈していますが、「この数値までならOK」という明確な基準があるならご教授願いたいです。
⓶作成する決定木の数について:なにもいじっていない、つまりデフォルトで分析するのはダメなのでしょうか?
独学で勉強しましたがどうしてもよくわからないので、教えていただけると嬉しいです。
ここにふさわしくない質問だったら申し訳ありません。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/11/14 10:37