[python]条件に合致した要素を別のデータフレームから取得し反映する方法をお教えください

Question

###前提・実現したいことデータフレーム1のindexと列2がデータフレーム2の列1、列2と一致するとき、列3にデータフレーム1の列3が出力されるようにしたいです。〇インプット <データフレーム1> INDEX　　列1　　列2 A1　　　　　6:00　　x1 A1　　　　　7:00　　x2 B2　　　　　8:00　　x1 B2　　　　　9:00　　x2 <データフレーム2> INDEX　　列1　　列2 0　　　　　　A1　　x1 1　　　　　　A1　　x2 2　　　　　　B2　　x1 3　　　　　　B2　　x2 〇アウトプット（期待結果） (index) 　　列1　　列2 列3 0　　　　　　A1 x1 6:00 1　　　　　　A1 x2 7:00 2　　　　　　B2 x1 8:00 3　　　　　　B2 x2 9:00 ###試したことデータフレーム1を列2で抽出（※）し、抽出後の列2をキーにMERGEで結合させようなどとしましたが、エラーが出ます。[エラーメッセージ → TypeError: unhashable type: 'set']、 ※<データフレーム1（列2=x1）> INDEX　　列1　　列2 A1　　　　　6:00　　x1 B2　　　　　8:00　　x1 よろしくお願いします。 ###補足情報(言語/FW/ツール等のバージョンなど) python3 ,jupyter Note

Accepted Answer

こんな感じでしょうか
```Python
import pandas as pd

df1 = pd.DataFrame({'列1':['6:00','7:00','8:00','9:00'],
                    '列2':['x1','x2','x1','x2']},
                    index=['A1','A1','B2','B2'])

df2 = pd.DataFrame({'列1':['A1','A1','B2','B2'],
                    '列2':['x1','x2','x1','x2']},
                    index=[0,1,2,3])

# Merge
df = pd.merge(df2, df1.reset_index(), left_on=['列1','列2'], right_on=['index','列2'])
# Column名を調整
df = df.rename(columns={'列1_x':'列1', '列1_y':'列3'}).drop('index', axis=1)
print(df)
#    列1  列2    列3
# 0  A1  x1  6:00
# 1  A1  x2  7:00
# 2  B2  x1  8:00
# 3  B2  x2  9:00
```

Answer

pythonなど不要。そう、シェル芸ならね！
```bash
$ cat data1
A1 6:00 x1
A1 7:00 x2
B2 8:00 x1
B2 9:00 x2

$ cat data2
0 A1 x1
1 A1 x2
2 B2 x1
3 B2 x2

$ join -o2.2,2.3,2.4,1.2 <(cat data1|awk '$0=$1"-"$3" "$2'|sort) <(cat data2|awk '$0=$2"-"$3" "$1" "$2" "$3'|sort)|sort
0 A1 x1 6:00
1 A1 x2 7:00
2 B2 x1 8:00
3 B2 x2 9:00
```

関連した質問