df.columnsで、列名のみを取り出す方法

前提・実現したいこと

pandasのdf.columnsにより列名のみを抽出したいのですが、"dtype"が入ってしまいます。
列名のみを、文字列の配列として取り出す方法はありますでしょうか。

> print(df.columns[df.mean()>2])
Index(['b', 'c'], dtype='object')

具体的に書くと、category_encodersを用いて、df.columnsで抽出した列名を用いてカテゴリ特徴量を作りたいのですが、df.columnsで抽出するとうまくいきません。

該当のソースコード

python
1import pandas as pd
2import category_encoders as ce
3
4df = pd.DataFrame([[1,2,3],[2,3,4]], columns=['a','b','c'])
5
6list_cols = df.columns[df.mean()>2]
7#list_cols = ['b','c'] こっちだとエラーなく成功する
8
9ce_ohe = ce.OneHotEncoder(cols=list_cols)
10df_session = ce_ohe.fit_transform(df)

エラーメッセージ

/Applications/anaconda3/lib/python3.6/site-packages/pandas/core/indexes/base.py in __nonzero__(self)
   1620         Index(['a', 'b', 'c'], dtype='object')
   1621         """
-> 1622         self._validate_index_level(level)
   1623         return self
   1624 

ValueError: The truth value of a Index is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

試したこと

上記のソースコード中の、"こっちだとエラーなく成功する"のリストを使うとうまくいきます。

行動規範の内容に同意します

回答1件

ベストアンサー

Python
1list_cols = df.columns[df.mean()>2].values

でどうですか？

投稿2019/09/12 07:11

magichan

総合スコア15898

ataoka

2019/09/12 07:14

うまくいきました！迅速に回答いただきありがとうございました。助かりました。 (printした際に、dtype=の表記が残っているためできないかと思っておりました。)

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.30%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

前提・実現したいこと

該当のソースコード

試したこと

関連した質問