時間ごとに単純移動平均を計算する：Pandas

Question

###前提・実現したいこと
お世話になります。時間ごとに区切って単純移動平均を出したいと思っています。

例えばこんなデータがあるとします。
```ここに言語を入力
//data.csv
time,val
10:00:00.111,65
10:00:00.555,68
10:00:00.888,37
10:00:01.111,34
10:00:01.222,36
10:00:01.333,34
10:00:01.555,12
10:00:01.888,64
10:00:02.111,94
10:00:02.555,54
10:00:02.888,47
10:00:03.111,35
10:00:03.555,48
10:00:03.888,43
・
・
```
一秒ごとに取れる値の数がまちまちで，10:00:00台では3個、10:00:01台では5個だったりします。
この中で3秒ごとに取れたデータを平均して1.5秒づつずらして単純移動平均計算したいと思っています。
例えば
- 10:00:03.000では10:00:00.000から10:00:03.000の間に取れた値を平均して10:00:03.000の横に出力する
- 10:00:04.500では10:00:01.500から10:00:04.500の間に取れた値を平均して10:00:04.500の横に出力する
- 10:00:06.000では10:00:03.000から10:00:06.000の間に取れた値を平均して10:00:06.000の横に出力する
という計算を繰り返します。アウトプットイメージとしてはこんな感じでしょうか。
```ここに言語を入力
//Output.csv（aveの値は適当に入れた）
time,ave
10:00:00,000,Nan
10:00:01.500,Nan
10:00:03.000,37
10:00:04.500,34
10:00:06.000,64
・
・
・
```

###試したこと
先程調べた限りでは、rollingを使えばのようなものは出来るみたいです。
```python
import pandas as pd

my_parser = lambda date: pd.datetime.strptime('%h:%m:%s.%f')

# ファイルを読み込む
df = pd.read_csv('data.csv', date_parser=my_parser)

df_new = df.rolling(window=3, min_periods=3).mean()
```
rollingの場合は移動平均に必要な個数が決まっています。今回行いたいのは時間ごとに枠をずらして，任意の枠に取得できた個数分を平均したいです。

お手数ですが、方法を教えていただければと思います。

Accepted Answer

こんな感じでよろしいでしょうか？

> もう少しスマートに書ける気がしますが、とりあえず。


data.csv
```
time,val
10:00:00.111,65
10:00:00.555,68
10:00:00.888,37
10:00:01.111,34
10:00:01.222,36
10:00:01.333,34
10:00:01.555,12
10:00:01.888,64
10:00:02.111,94
10:00:02.555,54
10:00:02.888,47
10:00:03.111,35
10:00:03.555,48
10:00:03.888,43
```

sample.py
```Python
import pandas as pd
# Data読み込み
my_parser = lambda time: pd.datetime.strptime('2017-04-01 {}'.format(time), '%Y-%m-%d %H:%M:%S.%f')
df = pd.read_csv('data.csv', date_parser=my_parser, parse_dates=['time'])
# DataTimeIndexを生成
index = pd.date_range('2017-04-01 10:00:00', '2017-04-01 10:00:30', freq='1500ms')
# 平均を求める際の時間範囲
range = pd.DateOffset(seconds=3)
# 移動平均を計算
result = pd.DataFrame([df[(df['time'] >= d) & (df['time'] <= d+range)]['val'].mean()  for d in index], index=index, columns=['MovingAverage'])
print(result)
```


やっていることは、コードを見ていただけると解ると思いますが、
1. まず、10:00:00から10:00:30まで1.5秒Stepの __DateTimeIndex__ を生成
2. __DateTimeIndex__ の各行毎に各データが時間範囲内かどうかを求める
3. __DateTimeIndex__ の各行毎に時間範囲内のデータの平均値を算出
4. DateTimeIndexと平均値データによりDataFrameを構築
となっております。

> なお、本来は時刻情報だけ結果を算出したほうがよさそうですが、
> 時間範囲かどうかを求める条件文を簡略化する都合上、適当な
> 年月日(2017/04/01)を使用してDateTime情報を生成しております。

関連した質問