Bのファイルから、Aのファイルのリストと合致しないデータを全て抽出したいのですが、コマンドがわかりません。
例えば、ある市町村の桜開花日のデータがAファイルにあり、Bには調査したい市町村リストがあるとします。
データのない(調査していない)市町村のリストを定期的にチェックしたいと思っています。「isin」の前後にfalseなど入れるのかなと思ったのですが・・・うまくいきませんでした。
エクセルのcountif関数もありますが、pythonだとファイルを開かずにデータ整理ができるので、pythonでできたら良いなと思っています。
リストの列名は、どちらも同じ項目名(この例だと”市町村”)を使用しています。
dfA = pd.read_csv('桜.csv', encoding="cp932")
dfB = pd.read_csv('調査中.csv', encoding="cp932")
list = dfA["市町村"]
df = dfB[dfB["市町村".isin([list])]]
df.to_csv('追加.csv', encoding='cp932')
各リスト(この例だと市町村)をそれぞれ照合し、Aの調査済リストにはないBの市町村をリストアップし、未調査の市町村リストを明確にしたいです。
dfA head(200)
市町村 開花予想日 開花日
a 2018/03/26 2018/03/26
c 2018/03/27 2018/03/26
f 2018/03/28 2018/03/29
b 2018/03/29 2018/03/28
p 2018/03/25 2018/03/26
..............
dfB head(20)
市町村 開花予想日
c 2018/03/27
f 2018/03/28
.......

回答3件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/03/12 06:10
退会済みユーザー
2018/03/12 06:32
2018/03/12 07:23 編集
退会済みユーザー
2018/03/13 01:53 編集