質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

0回答

1772閲覧

lightGBMにおけるimportanceによるcolumnsの順位付け→その順位順にカラムを並べ替え、の際にカラム数増加してしまいます。。

pickle

総合スコア16

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/05/21 07:53

編集2022/01/12 10:55

すみません、以下誤りが発覚しまして解決しました。

削除リクエストが却下されてしまい残ってしまいました

lightGBMを使用してmodelの作成・学習の後に、columns(説明変数に相当)のimportanceを出し、そのimportanceが高い順に元のdataを並び替えることを試みました。

元のdata(dataframe形式) X_train(10000行×350列)、y_train(10000行)を用いてlightGBMで学習させ、その学習させたmodelを"gbm"と名付けました。

その後、fiというdataframeにX_trainのcolumnsを入れたfeature_name、importanceを入れた"importance"、というcolumnsを作成しました。

python

1print(len(X_train.shape)) #(10000,350)⭐️ 2print(len(y_train.shape)) #(10000,) 3 4fi = pd.DataFrame() 5fi['importance'] = gbm.feature_importance(importance_type='gain') 6fi['feature'] = gbm.feature_name() 7 8# fiのimportanceの高い順による並び替え 9fi = fi.sort_values(by="importance"),ascending=False) 10 11# fi_newにfi["feature"]を格納 12fi_new = fi["feature"] 13 14# 確認 15print(len(fi_new)) # 350⭐️ 16 17# X_trainをcolumnのimportance順に並び替え(fi_newを用いて) 18X_train_new = X_train[fi_new] 19 20# 確認 21print(len(X_train_new)) # 470⭐️ 22

本来ならcolumnのimportance順に並び替えたX_train_newのcolumns数も元と同じ350であるべきの所、なぜかcolumn数が増えてしまいました。
print(len(X_train_new.columns.unique()))で確認した所、元と同じ350が出てきており、どうやら重複したcolumnsが作成されていた様です。

原因がはっきりしません、お分かりになる方がいましたらご教授いただけますと幸いです。
(PS.元データがあげられないものになっており、参照できずすみません。)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問