質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

2回答

654閲覧

python pandas データフレームの結合方法について

Platycerium

総合スコア34

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2021/07/05 05:49

pythonのpandasを使用して2つのデータフレームを結合して、共通の列があれば更新しようとしています。
df1をベースとして、df2に共通のIDがあればcode列を更新し、df2にしかないdata列は追加して以下のような結果にしたいです。
列の順番は入れ替わっても問題はありません。

ID Info value code data
B 442 12 BB Y
C 998 12 CC X
D 45 12 DD Y
F 777 12 F

色々調べて試みましたがうまく機能しない為、ご教示いただきたく存じます。

import pandas as pd df1 = pd.DataFrame(data=[ ["B", 442,12,"B"], ["C", 998,12,"C"], ["D", 45,12,"D"], ["F", 777,12,"F"]] , columns=["ID", "Info","value","code"]) df2 = pd.DataFrame(data=[ ["A", "X","AA"], ["B", "Y","BB"], ["C", "X","CC"], ["D", "Y","DD"], ["E", "Y","EE"] ] ,columns=["ID", "data","code"]) #検証1 #df=pd.merge(df1, df2, on='ID', how='left') #重複列が_xとなってしまう #検証2 #df = df1[['ID', 'Info', 'value']].merge(df2[['ID', 'data', 'code']], on='ID', how='left')#IDがFの部分のdataがNaNとなってしまう print(df)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

検証1のコードに少し手を加えるだけでよいです。

Python

1import pandas as pd 2 3df1 = pd.DataFrame(data=[ 4["B", 442,12,"B"], 5["C", 998,12,"C"], 6["D", 45,12,"D"], 7["F", 777,12,"F"]] 8, columns=["ID", "Info","value","code"]) 9 10df2 = pd.DataFrame(data=[ 11["A", "X","AA"], 12["B", "Y","BB"], 13["C", "X","CC"], 14["D", "Y","DD"], 15["E", "Y","EE"] 16] 17,columns=["ID", "data","code"]) 18 19# df2側の重複列にはサフィックスをつけない 20df = pd.merge(df1, df2, on='ID', how='left', suffixes = ['_x','']) 21 22# df2側にないcode値はdf1の値を採用する 23df['code'].fillna(df['code_x'], inplace=True) 24 25# 必要な列のみ抽出&data列のNaNを空文字に 26df = df[['ID','Info','value','code','data']].fillna('') 27 28print(df) 29# ID Info value code data 30#0 B 442 12 BB Y 31#1 C 998 12 CC X 32#2 D 45 12 DD Y 33#3 F 777 12 F

投稿2021/07/05 06:33

can110

総合スコア38278

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Platycerium

2021/07/05 07:53

ご回答いただきありがとうございました。 コメントも分かりやすく大変勉強になりました。
guest

0

「検証1」をベースに書いてみました。

python3

1import pandas as pd 2 3df1 = pd.DataFrame(data=[ 4["B", 442,12,"B"], 5["C", 998,12,"C"], 6["D", 45,12,"D"], 7["F", 777,12,"F"]] 8, columns=["ID", "Info","value","code"]) 9 10df2 = pd.DataFrame(data=[ 11["A", "X","AA"], 12["B", "Y","BB"], 13["C", "X","CC"], 14["D", "Y","DD"], 15["E", "Y","EE"] 16] 17,columns=["ID", "data","code"]) 18 19#検証1 20df=pd.merge(df1, df2, on='ID', how='left') 21df["code"] = df["code_y"] 22df["code"] = df["code"].fillna(df["code_x"]) 23df = df.drop(["code_x", "code_y"], axis=1) 24print(df) 25# ID Info value data code 26# 0 B 442 12 Y BB 27# 1 C 998 12 X CC 28# 2 D 45 12 Y DD 29# 3 F 777 12 NaN F 30

投稿2021/07/05 06:31

jeanbiego

総合スコア3966

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Platycerium

2021/07/05 07:53

ご回答いただきありがとうございました。 たいへん参考になりました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問