現在、下記のようなDataFrameを取り扱っています。
index_A | index_B | val_A | val_B | val_C |
---|---|---|---|---|
a | x | aaa | ||
a | x | bbb | ||
b | x | aaa | ||
b | y | xxx | ||
b | y | 100 |
このデータについて、index_Aとindex_Bが重複するデータを、一行にまとめ、下記のように編集したいと考えています。
index_A | index_B | val_A | val_B | val_C |
---|---|---|---|---|
a | x | aaa | bbb | |
b | x | aaa | ||
b | y | xxx | 100 |
各行のデータはval_A, val_B, val_Cのいずれかにしか値が入っておらず、
マージする際に値がコンフリクトしない形式になっています。
自身で思いついた手段としては、一行目のみのデータフレームを作成し、
そこに残りの行をiterrows()でとりだして一行ずつpd.merge()する方法なのですが、
よりよい方法があるのではないかと思い質問させていただきました。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/02/22 00:11