crossさせた1つのCSVデータから条件で列データ抽出したい

前提・実現したいこと

1つ目のcsvには行ごとに1つのデータが入っていてその列に時間のデータが入っている。2つ目のcsvも行ごとにデータが入っており開始時間、終了時間、抽出したいデータ列が入っている。この1つ目のcsvの時間が2つ目のcsvの開始時間、終了時間の間に当てはまったら同じ行の抽出したいデータ列を抽出し、1つ目のcsvに出力したい。そのため2つのcsvをcrossさせ行ごとに1つのデータになっているcsvと作り、その行内には開始時間、終了時間、時間、データ、の列があるので、この時間の列の値が開始時間と終了時間の間に当てはまればデータの列の値を取り出し、元の1つ目のcsvに出力したい

発生している問題・エラーメッセージ

開始時間と終了時間に当てはまる時間は1つしかないはずなので1つのデータだけが取り出されるはずだが、複数のデータが抽出されてしまう。
時間の形式は2020/12/11  3:23:00のような感じで開始時間と終了時間ともに同様の形式です。

該当のソースコード

df1 = pd.read_csv('データ1.csv', parse_dates=True,encoding='shift jis')


df2 = pd.read_csv('データ2.csv',parse_dates=True,encoding='shift jis')

df_cross = pd.merge(df1,df2,how='cross')
result = pd.merge(df1, df_cross[(df_cross['表示開始時間']<df_cross['時間']) & (df_cross['時間']<df_cross['表示終了時間'])][['時間','１面目上段表示内容','２面目上段表示内容']], how='left')

補足情報（FW/ツールのバージョンなど）

python

行動規範の内容に同意します

回答1件

ベストアンサー

Cross join ではなくセレクタを使ってみました。

python
1import pandas as pd
2import numpy as np
3from io import StringIO
4
5pd.set_option('display.unicode.east_asian_width', True)
6
7data1 = '''
8時間
92021/12/10 08:54:00
102021/12/10 10:25:00
112021/12/10 13:32:00
122021/12/10 15:18:00
132021/12/10 17:41:00
14'''.strip()
15
16data2 = '''
17開始時間,終了時間,データ
182021/12/10 08:00:00,2021/12/10 09:00:00,i
192021/12/10 09:00:00,2021/12/10 10:00:00,j
202021/12/10 10:00:00,2021/12/10 11:00:00,k
212021/12/10 11:00:00,2021/12/10 12:00:00,l
222021/12/10 12:00:00,2021/12/10 13:00:00,m
232021/12/10 13:00:00,2021/12/10 14:00:00,n
242021/12/10 14:00:00,2021/12/10 15:00:00,o
252021/12/10 15:00:00,2021/12/10 16:00:00,p
262021/12/10 16:00:00,2021/12/10 17:00:00,q
272021/12/10 17:00:00,2021/12/10 18:00:00,r
282021/12/10 18:00:00,2021/12/10 19:00:00,s
29'''.strip()
30
31df1 = pd.read_csv(StringIO(data1), parse_dates=[0])
32df2 = pd.read_csv(StringIO(data2), parse_dates=[0, 1])
33
34# 抽出
35df1['データ'] = df1['時間'].apply(lambda t:
36    np.nan
37    if (x:=df2[(t>=df2['開始時間'])&(t<df2['終了時間'])]).empty
38    else x['データ'].values[0])
39
40print(df1)
41
42#
43                 時間 データ
440 2021-12-10 08:54:00      i
451 2021-12-10 10:25:00      k
462 2021-12-10 13:32:00      n
473 2021-12-10 15:18:00      p
484 2021-12-10 17:41:00      r