【質問】Pandasのデータフレームの結合について
pythonでpandasを用いてデータを結合させます。
その際に、特定列が一致しているもののみ結合させます。
以下にコードを示します。しかし、この時に課題になるのが、
結合を繰り返す場合、結合する毎に列が増えてしまいます。
下記例では、業種_xと業種_yが出来てしまいます。
なんとか業種1行に値を集約する方法はないでしょうか。
(値が重複した場合は、上書きされて構いません)
【コード】
df10 = pd.DataFrame([
[3320,"東1", 2, 3,"aaa"],
[6701,"東2", 11, 12,],
[4536,"M", 11, 12,],
[7777,"M", 5, 10,]])
df10.columns=["番号","市場","前日比","利益","業種"]
df12 = pd.DataFrame([
[3320,"電気"],
[6701,"石油"],
[4536,"通信"],
[7777,]])
df12.columns=["番号","業種"]
print(pd.merge(df10,df12,on="code"))
【出力】
番号 市場 前日比 利益 業種_x 業種_y
0 6701 東2 11 12 None 石油
1 4536 M 11 12 None 通信
2 7777 M 5 10 None None
回答1件
あなたの回答
tips
プレビュー