pythonでランダムフォレストのコードをサイトから書いていますが,
寄与率の計算の際にfeature_namesの定義をしたいのですが方法がわかりません。
以下のエクセルcsvを読み込んで,A,B,C,・・・・・をfeature_namesとして設定したいです。
よろしくお願いいたします。
特徴量の寄与率を計算
importances = clf.feature_importances_
print("{0:<20}".format ("feature names"), "importances")
feature_names = df8.feature_names
for (feature_name, importance) in zip(feature_names, importances):
print("{0:<20}".format (feature_name), importance)
「寄与率の計算の際に」←コードを提示してください。
計算で用いる部分を追加しました。
ご質問の意味がわかりません
feature_namesは通常は説明変数のカラム名になると思います
それとは変えたいということでしょうか
どういう出力を期待されて、どういう出力になってしまっていて困られているのかがわかりません
なにもせずA,B,Cとして設定されるということでしょうか。
すみません。私自身あまり整理できておらず,,,
期待している結果は,0,1,2,,のデータが説明変数A,B,,,,によって三つに分類され,A,B,C,,,のどの値が効いているかを出力することです。
「df8」が何を表しているのか不明です。
一部分ではなく第三者が実行、検証できるコードを提示ください。
回答2件
あなたの回答
tips
プレビュー
