DataFrameで、30行ごとに平均を出したい

前提・実現したいこと

DataFrameで、30行ごとに平均を出したいです。
より正確には、1分あたりの数値が記録されているdataframeで、30分ごとの平均値を求めたいです。

該当のソースコード

python
1
2import pandas as pd
3import random
4
5df = pd.DataFrame([random.randint(10,30) for i in range(90)],index=pd.date_range(start='2021/8/1',periods=90,freq='T'),columns=['data'])
6
7data
82021-08-01 00:00:00	25
92021-08-01 00:01:00	28
102021-08-01 00:02:00	18
112021-08-01 00:03:00	30
122021-08-01 00:04:00	25
13...	...
142021-08-01 01:25:00	10
152021-08-01 01:26:00	22
162021-08-01 01:27:00	13
172021-08-01 01:28:00	16
182021-08-01 01:29:00	25

試したこと

30行ごとに分割してdf.mean()を繰り返そうかと思いましたが、そのデータを再びdataframeに戻す方法がわかりませんでした。
そもそも、分割せずとも平均を出すことができるのではないかと思い質問するに至りました。
よろしくお願いいたします。

meg_

2021/12/27 10:00

> 30行ごとに分割してdf.mean()を繰り返そうかと思いましたが、そのデータを再びdataframeに戻す方法がわかりませんでした。それはどのようなコードでしょうか？質問に追記いただけませんか？

行動規範の内容に同意します

回答2件

以下です。

python
1>>> import pandas as pd
2>>> import random
3>>>
4>>> df = pd.DataFrame([random.randint(10,30) for i in range(90)],index=pd.date_range(start='2021/8/1',periods=90,freq='T'),columns=['data'])
5>>>
6>>> df2 = df.reset_index()
7>>>
8>>> def f(df):
9...     m = df.head(1)
10...     m.iat[0,1] = df.iloc[:,1:2].mean()[0]
11...     return m
12...
13>>> df3 = df2.groupby(df2.index//30).apply(f)
14>>> print(df3)
15                   index       data
160 0  2021-08-01 00:00:00  20.800000
171 30 2021-08-01 00:30:00  18.866667
182 60 2021-08-01 01:00:00  18.000000

投稿2021/12/27 10:11

ppaul

総合スコア24670

ベストアンサー

python
1import pandas as pd
2import random
3
4df = pd.DataFrame([random.randint(10,30) for i in range(90)],index=pd.date_range(start='2021/8/1',periods=90,freq='T'),columns=['data'])
5
6print(df.groupby(df.index.floor('30min')).mean())
7
8#
9                          data
102021-08-01 00:00:00  21.766667
112021-08-01 00:30:00  19.966667
122021-08-01 01:00:00  19.900000