異なるDataFrame間で、ある列で値を検索し、一致するデータ行の、別カラムからデータを取得し、一致を確認したいです。
エクセルで言えばvlookup関数の結果同士を比較するのに近いのですが、具体的には、以下のようなイメージです。
<df_a>
col_a | col_c | col_d |
---|---|---|
1 | aaa | bbb |
2 | ccc | ddd |
3 | abc | fff |
<df_b>
col_b | col_c | col_d |
---|---|---|
101 | ggg | hhh |
102 | abc | iii |
103 | jjj | kkk |
上記で、df_aにおいてcol_a = 3が指定されれば、該当行のcol_bの"abc"を返し、df_bにおいてcol_b = 102が指定されれば同じく"abc"を返し、両者が一致。
このような処理を何万件も実施するのですが、Pythonで実行する場合、どのように処理するのが一般的でしょうか?
rowのindexを割り当ててdictionaryで処理するのが真っ当かと思ったのですが、勝手ながら可能なら別dfを立てず、indexも割り当てずそのままに出来ればありがたいです。
①indexを割り当てる方法
②indexを割り当てない方法
③処理の速い方法(実測値などは不要で、こっちの方が経験則的におすすめ、程度で結構です)
以上、ご教示いただければ幸いです。何卒よろしくお願い申し上げます。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2022/04/22 00:45