データフレームのマージで共通するものがあれば新しい列を作成してそちらにデータを入れたい。

お世話になっております。
Pandasのデータフレームのマージ機能を使って下記図のようなことをやりたいです
もし、共通のものがあれば新しい行を作成して追加するのではなく、新しい列を追加してそこに追加する
行数は変えない。という感じです
下記図の場合、新しく追加するTitle列のコラム名前はどんなものでも構いません
※下記図のDataA基準というのはDataAのHash基準、という意味です

考え方だけでも良いのでご教示いただけますと幸いです。

一応下記にデータフレームのコードを貼っておきます。


dfA = pd.DataFrame({'HASH':['000x','001X'],'TimeStamp':['11','22']})

dfB = pd.DataFrame({'HASH':['000x','000x','003x'], 'Title':['A','B','C']})

宜しくお願い致します。

行動規範の内容に同意します

回答2件

ベストアンサー

予め、dfB のデータをgroupby()などで加工して Titleを横並びにした後に DataFrame.merge() をすると良いかと思います。

Python
1import pandas as pd
2
3dfA = pd.DataFrame({'HASH':['000x','001X'],'TimeStamp':['11','22']})
4dfB = pd.DataFrame({'HASH':['000x','000x','003x'],
5                    'Title':['A','B','C']})
6
7tmp = dfB.groupby('HASH').apply(lambda d:d['Title'].reset_index(drop=True)).unstack()
8tmp = tmp.rename(columns={i:"Title{}".format(i) for i in range(10)})
9result = dfA.merge(tmp, on='HASH', how='left')
10print(result)
11#   HASH TimeStamp Title0 Title1
12#0  000x        11      A      B
13#1  001X        22    NaN    NaN

投稿2019/04/19 06:57

magichan

総合スコア15898

trey_0329

2019/04/19 07:52

ありがとうございます！ずっと考えていたんですが、どうも考えが思い浮かばず。。。大変勉強になりました。誠にありがとうございます

行動規範の内容に同意します

dfBの同じHASHのTitleを横持ちにするのが問題だと思います。
それについては、groupbyを使うのがいいと思います。

python
1dfB = pd.DataFrame({'HASH':['000x','000x','003x'], 'Title':['A','B','C']})
2g = dfB.groupby('HASH')
3col_num = max(g.size())
4df2 = pd.DataFrame(columns=range(col_num))
5for d in g:
6    df2.loc[d[0]] = d[1]['Title'].reset_index(drop=True)
7# 列名の変更
8df2.columns = [f'Title{i}' for i in range(col_num)]

df2 は以下のようになるので、あとはマージするだけです。

 	Title0 	Title1
000x 	A 	B
003x 	C 	NaN

投稿2019/04/19 08:10

YasuhiroNiji

総合スコア584

trey_0329

2019/04/19 08:46

ありがとうございます！ Groupbyは全く考えになかったので、大変勉強になりました。わざわざご丁寧にありがとうございます。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.30%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問