[Python/Pandas]要素数が1の列をまとめて削除する方法

前提・実現したいこと

Pandasで機械学習の前処理を行っています。
特徴量を削減するために、uniqueな要素数が1つしかない列を削除したいのですがどのように行えば良いのかが分かりません。

具体例

変数dfが以下のようなDataFrameを持っているとき、全ての要素が同じ列(今回であれば「県」と「年齢」)をまとめて削除したいです。
・削除前

	県	名前	年齢
0	東京	田中	23
1	東京	鈴木	23
2	東京	高橋	23
3	東京	加藤	23

・削除後

	名前
0	田中
1	鈴木
2	高橋
3	加藤

試したこと

df.nunique()

とすれば列名とその要素数が取得できると思いますが、そこから要素数が1の列名だけを抽出する方法が分かりません。具体例では小さなDataFrameを例にしましたが、実際にはもっと大きなDataFrameを扱っているので手作業で要素数が1の列の列名を入力するのでなく、一括してそのような列名が抽出できる方法を知りたいです。

df.drop(labels=['県', '年齢'], axis=1)

とすれば今回の場合は要素数が1の列を削除できますが、['県', '年齢']の部分をプログラム上で一括して取得するためにはどうすればいいかをお伺いしたいです。

補足情報（バージョン）

Python 3.7.4
Pandas 1.1.3

meg_

2020/10/14 05:32

削除前のデータフレームと削除後のデータフレームを提示いただくと分かりやすいと思います。

asiaticum

2020/10/14 05:38

ご指摘いただきありがとうございました。削除後のデータフレームを例として提示しました。

行動規範の内容に同意します

回答2件

ベストアンサー

Boolean indexingを利用して、

python
1df.loc[:, df.nunique() > 1]

投稿2020/10/14 06:32

kirara0048

総合スコア1399

asiaticum

2020/10/15 02:30

ありがとうございました！こんなにスッキリ書くことができたんですね。

行動規範の内容に同意します

~~たとえば、下記のような処理でしょうか。~~
~~県と年齢が重複している行を削除しています。~~
完全に誤読していました。
以下でどうでしょうか。

python3
1import io
2import pandas as pd
3data = """県   	 名前   	   年齢 
4  0 	 東京 	 田中   	     23 
5  1 	 東京 	 鈴木   	     23 
6  2 	 東京 	 高橋   	     23 
7  3 	 東京 	 加藤   	     23 
8  4 	 東京 	 田中   	     23 
9  5 	 東京 	 鈴木   	     24 
10  6 	 東京 	 高橋   	     25 
11  7 	 東京 	 斎藤   	     23"""
12df = pd.read_table(io.StringIO(data))
13df.columns = ['県', '名前', '年齢']
14
15for col in df.columns:
16    if df[col].nunique() == 1:
17        df = df.drop(col, axis=1)
18print(df)
19#    名前  年齢
20#0   田中     23
21#1   鈴木     23
22#2   高橋     23
23#3   加藤     23
24#4   田中     23
25#5   鈴木     24
26#6   高橋     25
27#7   斎藤     23

投稿2020/10/14 05:24

編集2020/10/14 05:54

jeanbiego

総合スコア3966

asiaticum

2020/10/14 05:47 編集

回答いただきありがとうございます。質問内容が分かりづらく大変申し訳ありませんが、要素が重複している行を削除したいというわけではなく、ある列の要素が1つしかないことを前提の上でそのような列を一括して削除したいというのが私の質問の趣旨でした。削除後どのような形になっていて欲しいかと、したい操作に関する追記をしましたので再度ご確認をしていただければ幸いです。