実現したいこと
・条件を満たす列の抽出
前提
環境はJupyterLabで、pythonを使用しています
csvファイルに大量の列があり、各列名は"ID+α"であり、αは列ごとに異なります
列の中から特定のIDを名前に含んだ列だけを抽出したファイルを作成したいです
特定のIDとは4桁の数で、それらは配列で与えられています
Python
1#列名の例 2columns = "0001_A","0002_B","0003_C", ... ,"0027_AA", ... 3#特定のID群の例 4arr = ["0001","0002","0005","0012", ... ]
いくつかの方法を調べましたが、上記を容易に解決できる方法が思い浮かびませんでした
発生している問題・エラーメッセージ
皆さんのお力をお借りできれば幸いです
よろしくおねがいいたします
調査したこと・試したこと
列名の一部にIDが含まれているため、pandasのfilterでlikeを行おうとしましたが
likeは文字列でしか使えないため、配列ごとは適用できませんでした
また、列を一つずつ抜き出したファイルを作成し、条件に沿ったファイルだけを結合しようとしましたが
複数ファイルの読み込みかつキー結合が必要なため、pandasや、スクリプトでも難しく断念いたしました
回答4件
あなたの回答
tips
プレビュー
下記のような回答は推奨されていません。
このような回答には修正を依頼しましょう。