Bのファイルから、Aのファイルのリストに合致するデータのみを全て抽出したいのですが
うまくいきません。
例えば、Aにはある市町村でみられる花のデータがあり、Bにはある市町村の食物(産物)のデータがあるとします。
(Aの市町村はBに必ず入っています。)
Bのファイルから、Aと同じ市町村(リスト)のデータのみを抽出し、新ファイルを作成したいのですがうまくいきません。
isinの使用法が違うのでしょうか。
照合したいリストの列名は、どちらも同じ項目名(この例だと”市町村”)を使用しています。
dfA = pd.read_csv('花.csv', encoding="cp932")
dfB = pd.read_csv('果物.csv', encoding="cp932")
list = dfA["市町村"]
df = dfB[dfB["市町村".isin([list])]]
df.to_csv('まとめ.csv', encoding='cp932')
追記します。
こんな感じのcsvです。
左のリスト(この例だと市町村)をそれぞれ照合し、最終的にはAのデータの右側にBのデータを追記したいです。
python利用だと一度にデータ加工ができそうと思ったのですが、
エクセルの重複などでデータ加工した方が早そうでしょうか。。。
dfA head(100)
市町村 花種 種巻き日 球根(種)収穫日
a チューリップ 2016/10/05 2017/05/08
b あさがお 2016/05/05 2016/08/27
c ローズ 2016/07/13 2016/12/01
..............
dfB head(1000)
市町村 果物 種巻き日 収穫日
a いちご 2016/12/05 2017/02/08
a さくらんぼ 2016/04/08 2016/06/11
a もも 2016/03/21 2016/07/30
c いちご 2016/12/15 2017/02/14
.......
回答3件
あなたの回答
tips
プレビュー