前提・実現したいこと
Pythonで時間がバラバラの時系列データを整形したい。
(○○分後、○○時間後のデータを比較したいので整形)
以下のようなデータが100万行くらいあります。
date カラム1 カラム2
2021-06-02 15:00:02 200 1.5
2021-06-02 15:10:00 100 2.5
2021-06-10 16:30:10 150 1.6
2021-06-10 16:20:10 500 1.7
........
........
発生している問題・エラーメッセージ
以下のようなforループを使うと、
データの量が多く5時間たっても処理が終わらず困っております。
Python
1L = len(df) 2for i in range(2,L): 3 k = df.index[i] 4 t1 = k - timedelta(hours=1) 5 t2 = k - timedelta(hours=2) 6 if df.index[i-1] == t1 and df.index[i-2] == t2: 7 a = df.loc[t2:k] 8 #aをappendでデーターフレームに追加
この方法しか思いつかなかったので、やってみたら案の定処理時間がかかりすぎて、、
Pythonのライブラリに処理が早くなるようなものがあったりしますでしょうか?
それかもっとスマートな方法がありますでしょうか?
よろしくお願い致します。
回答1件
あなたの回答
tips
プレビュー