Python・Pandasを用いて、同一データベースから抽出された複数のCSVファイルを統合して、元のデータベースを可能な限り復元しようとしています。
※同一データベースからSQLのSELECTで抽出された複数CSVを寄せ集めるイメージです。そのため、同一セルの値は各ファイルで同じです(以下の例で、A1はどのファイルでも同一、もしくはnan)。また、結びつけに使えるIDも振られています。
具体例として、以下のようにCSVファイル1とCSVファイル2とCSVファイル3を統合したいのですが、どのメソッドを使ったらいいでしょうか?
for文でMergeやConcatなどを書いてみたのですが、どうしても列や行が増えたりNanの処理ができず、うまくいきませんでした。
############元ファイル########
CSVファイル1
|ID|A|B|C|D|
|:--|:--:|-:|
|1|A1|B1|C1|D1|
|2|A2|B2|C2|D2|
|3|A3|B3|C3|D3|
CSVファイル2
|ID|A|B|E|F|
|:--|:--:|-:
|3|A3|B3|E3|F3|
|4|A4|B4|E4|F4|
CSVファイル3
|ID|F|G|
|:--|:--
|1|F1|G1|
###########上の3つのファイルから以下を作成#########
CSVファイル(1+2)
※行も列も重複をなくしたい
|ID|A|B|C|D|E|F|
|:--|:--:|-:|
|1|A1|B1|C1|D1|Nan|Nan|
|2|A2|B2|C2|D2|Nan|Nan|
|3|A3|B3|C3|D3|E3|F3|
|4|A4|B4|Nan|Nan|E4|F4|
CSVファイル(1+2+3)
※行も列も重複をなくしたい
||A|B|C|D|E|F|G|
|:--|:--:|-:|
|1|A1|B1|C1|D1|Nan|F1|G1|
|2|A2|B2|C2|D2|Nan|Nan|Nan|
|3|A3|B3|C3|D3|E3|F3|Nan|
|4|A4|B4|Nan|Nan|E4|F4|Nan|
回答1件
あなたの回答
tips
プレビュー