Pandasで以下のようなデータフレームがあります。
特徴としては、
・カラム名に一部重複がある
・重複の個数はわからない
・データの個数はばらばら
例えば
価格1 | 価格A | 価格3 |
---|---|---|
100 | 200 | NaN |
100 | NaN | NaN |
300 | 100 | NaN |
こういったデータに関して、正規表現でカラム名に価格が含まれるものを取得し、
最もデータ数が多い列のみ残すのによい方法はありませんか?
以下のような感じで正規表現にマッチするデータを取得したのですが、
これをカラム名を取得してループで確かめていくしかないでしょうか?
df.loc[df.columns.str.match(r'(.?)価格'(.?))]
よろしくお願いいたします。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。