質問編集履歴

追記

2020/09/20 03:13

投稿

スコア20

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -87,3 +87,23 @@
     time=DF1["time"][idx:idx+1]
     rate = df[df.time == pd.to_datetime(time).strftime('%Y-%m-%d %H:%M:00.00')]["open"].values[0]
+再追記：
+DF1ｔDF2では欠損の有無が違うため、インデックスは同じではないです。
+例えば、
+DF１には、インデックス：10の2014年2月27日10：00のデータがあっても、
+DF２では2014年2月27日10：00のデータを持っていないため、インデックス10は2014年2月27日10：15のデータである
+ということがあります。
+その為、DF1のインデックスからDF2の同じインデックスを検索できないです。

情報不足のため追記

2020/09/20 03:13

投稿

スコア20

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -48,4 +48,42 @@
 お分かりの方お教えいただきたく思います。
-よろしくお願いいたします
+よろしくお願いいたします。
+すみません。情報が不足していたため追記させて頂きます。
+追記：
+FXのバックテストを作成しており、2つの同じ構成のDFがあり、
+DF１の2014年2月27日14：00の時間から、DF２の2014年2月27日14：15のデータを取得しようとしています。
+timeに格納しているのは、以下のデータになります。
+import dask.dataframe as dd
+import pandas as pd
+DF1 = dd.read_csv("DF1.csv", blocksize=None, encoding='UTF-8').compute()
+DF1['time'] = pd.to_datetime(DF1['time'])
+DF1 = DF1.set_index('time').resample(axis).agg(
+            {'open': 'first', 'high': 'max', 'low': 'min', 'close': 'last', 'volume': 'sum'}).reset_index()
+for idx in range(DF1.shape[0])
+    time=DF1["time"][idx:idx+1]
+    rate = df[df.time == pd.to_datetime(time).strftime('%Y-%m-%d %H:%M:00.00')]["open"].values[0]