2つのcsvを読み込み、データを合体させ、重複する行を削除し、新しいcsvを作りたいのですが、効率良い方法をご存知の方がいらっしゃればご教示いただければ幸いです。
なお2つのcsvはヘッダーが同じデータです。
csv1
1#word.csv 2 3komoji,omoji #ヘッダー 4aaa,AAA 5bbb,BBB 6ccc,CCC
csv2
1 2#word_sub.csv 3 4komoji,omoji #ヘッダー 5aaa,AAA 6bbb,BBB
csv3(作りたいcsv)
1komoji,omoji #ヘッダー 2ccc,CCC # ← csv1とcsv2で重複しない行が残るイメージ
最初は、pandasで読み込み、mergeさせた後、二つのデータから重複するものを削除する方法で考えていましたがうまくできませんでした。他のやり方でも効率良い方法があ
python
1df1 = pd.read_csv('word.csv') #csv1_word.csvの取り込み 2df2 = pd.read_csv('word_sub.csv') # csv2_word_sub.csvの取り込み 3df3 = df + df2 4print(df3)
みたいにすると、、
aaacccc,AAABBB
Nan Nan
Nan Nan のように出力されます。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/02/02 11:19
2020/02/02 11:24
2020/02/03 09:32