以下の二つのpandasデータフレームについて。
pyhton
1df1 2 date_time_1 name_1 30 2020-12-01 06:10:00 a 41 2020-12-01 06:11:00 b 52 2020-12-01 06:16:00 c 63 2020-12-01 06:19:00 d 74 2020-12-01 06:24:00 e 8 9 10df2 11 date_time_2 name_2 120 2020-12-01 06:10:40 131 2020-12-01 06:11:20 142 2020-12-01 06:12:20 153 2020-12-01 06:13:15 164 2020-12-01 06:21:30 17
df2.['name_2']列に、df2.['date_time_2']の値が最も近いdf1.['date_time_1']を持つdf1.['name_1']の値を入れたいです。ただし、df1.['date_time_1']よりも後の時間である必要があります。
例えば、df2.loc[0, 'date_time_2']の'06:10:40'は、df1[1]の'06:11:00'に最も近いですが、df1[1]は選べません。したがって、df2.loc[0, 'name_2']には'a'が入ります。
df.index.get_loc('nearest')を使うと、うまく行きそうな気がして色々やってみましたが、データフレームに一括して適用するときの書き方がわかりません。forループで回そうとも思いましたが、うまくいきませんでした。そもそも、pandasもっと上手いやり方があるように思い質問いたしました。
うまく説明できていないかもしれません。
仰って頂ければ、補足いたします。
あなたの回答
tips
プレビュー