前提・実現したいこと
time | data |
---|---|
2018-06-01 00:03:00 | 0 |
2018-06-01 00:04:00 | 1 |
2018-06-01 01:05:00 | 0 |
2018-06-01 01:06:00 | 1 |
この様な抜けのある時系列データを、一時間単位でDataFrame.resampleすると
time | data |
---|---|
2018-06-01 00:00:00 | 1 |
2018-06-01 01:00:00 | 1 |
この様に最初のデータのタイムスタンプが00始まりになります。
これを元のデータと同じ開始時刻に揃え、
time | data |
---|---|
2018-06-01 00:03:00 | 1 |
2018-06-01 01:05:00 | 1 |
この様にしたいのです。
該当のソースコード
python
1import pandas as pd 2 3df = pd.DataFrame( 4 {'data':[0,1,0,1]}, 5 index = ["2018-06-01 00:03:00", 6 "2018-06-01 00:04:00", 7 "2018-06-01 01:05:00", 8 "2018-06-01 01:06:00",]) 9df.index = pd.to_datetime(df.index) 10 11print(df) 12# data 13#2018-06-01 00:03:00 0 14#2018-06-01 00:04:00 1 15#2018-06-01 01:05:00 0 16#2018-06-01 01:06:00 1 17 18print(df.resample('1H').sum()) 19# data 20#2018-06-01 00:00:00 1 21#2018-06-01 01:00:00 1
試したこと
実際のデータは巨大で、for文ではかなり時間が掛かってしまいました。
出来るだけ高速に実現する方法を探しています。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/06/18 12:49
2018/06/18 13:13
2018/06/18 13:21
2018/06/18 13:38
2018/06/18 13:44
2018/06/18 13:48
2018/06/18 14:16
2018/06/18 16:13 編集
2018/06/18 16:52
2018/06/19 04:23
2018/06/19 11:44