python pandas 複数の列でデータの出力を行いたい

現在、下記のようなコードを書いています。

import pandas as pd

measurement = pd.read_csv('uz_data.csv')

#データの読み込み
measurement['Time'] = pd.to_datetime(measurement['Time'])
measurement['Uz'] = measurement['Uz'].astype(float)

#空のデータフレームの作成
cols = ['1s', '1m','5m']
df = pd.DataFrame(index=[], columns=cols)

average_1s = measurement.groupby(pd.Grouper(key="Time", freq="1S")).mean().dropna()
print(average_1s)
average_1s.to_csv('Uz_1s.csv')

average_1m = measurement.groupby(pd.Grouper(key="Time", freq="1min")).mean().dropna()
print(average_1m)
average_1m.to_csv('Uz_1m.csv')

average_5m = measurement.groupby(pd.Grouper(key="Time", freq="5min")).mean().dropna()
print(average_5m)
average_5m.to_csv('Uz_5m.csv')

df = pd.concat([average_1s, average_1m,average_5m], axis=1, ignore_index=True)
df.to_csv('test.csv')

uz_data.csvはダウンロードから入手できます。

ただ、このコードの問題として
average_1s
と
average_1m
と
average_5m
が下記のように出力されてしまいます。

一番左の時間軸にすべてのデータがあわされて出力されるので、1分平均や5分平均などの値はかなり次の値が出てくるまでかなり隙間が生じています。あと、列名も0，1，2のようになっていますが、これも1s、1m、5mなどを出力したいです。

つまり、理想の出力の形は

のような形式で出力したいです。

8524ba23

2021/10/21 04:44

理想の（欲しい）出力結果を提示ください。たとえば10分間のデータなら1分毎の10行＋5分毎の2行の内容がそれぞれ別列に入り、計12行が縦につながったものになる感じでしょうか？

8524ba23

2021/10/21 13:41

同一行に事なる時間の値を（無理やり）詰め込む感じでしょうか…

Tubasa1995

2021/10/21 13:43

そういうことになります。

Tubasa1995

2021/10/21 13:45

だた、単に詰め込むわけではなく、Timeの列も追加します。

8524ba23

2021/10/21 13:49

うーん、それならそれぞれ別のデータフレームとして分けたほうがよいと思いますが… 「私ならこうする」という回答をしておきます。

行動規範の内容に同意します

回答1件

欲しい結果とは異なると思いますが、私なら以下のようにします。
同じ時刻の行の値は１行にまとめます。その方がのちの処理で扱いやすいと思うからです。
それに該当しない「隙間」の行の値は先頭（最初）の値をセットします。

Python
1import pandas as pd
2from datetime import datetime, timedelta
3
4# テストデータ
5times = [datetime(2021,10,12,8,30) + timedelta(minutes=i) for i in range(10)]
6df = pd.DataFrame({'Time':times, 'Uz':range(len(times))})
7
8# 各時間間隔毎に集計。値の列名はその間隔を表す文字列をそのままセット
9dfs = []
10for freq in ['1min', '2min', '3min']:
11    dfs.append( df.groupby(pd.Grouper(key="Time", freq=freq)).mean().dropna().rename(columns={'Uz':freq}))
12
13# 集計結果を同一時間にまとめて列方向に連結
14ret = pd.concat(dfs, axis=1)
15print(ret)
16"""
17                     1min  2min  3min
18Time
192021-10-12 08:30:00   0.0   0.5   1.0
202021-10-12 08:31:00   1.0   NaN   NaN
212021-10-12 08:32:00   2.0   2.5   NaN
222021-10-12 08:33:00   3.0   NaN   4.0
232021-10-12 08:34:00   4.0   4.5   NaN
242021-10-12 08:35:00   5.0   NaN   NaN
252021-10-12 08:36:00   6.0   6.5   7.0
262021-10-12 08:37:00   7.0   NaN   NaN
272021-10-12 08:38:00   8.0   8.5   NaN
282021-10-12 08:39:00   9.0   NaN   9.0
29"""
30
31# 時間軸に該当しない値は先頭行の値を採用
32ret = ret.fillna(method='ffill')
33print(ret)
34"""
35                     1min  2min  3min
36Time
372021-10-12 08:30:00   0.0   0.5   1.0
382021-10-12 08:31:00   1.0   0.5   1.0
392021-10-12 08:32:00   2.0   2.5   1.0
402021-10-12 08:33:00   3.0   2.5   4.0
412021-10-12 08:34:00   4.0   4.5   4.0
422021-10-12 08:35:00   5.0   4.5   4.0
432021-10-12 08:36:00   6.0   6.5   7.0
442021-10-12 08:37:00   7.0   6.5   7.0
452021-10-12 08:38:00   8.0   8.5   7.0
462021-10-12 08:39:00   9.0   8.5   9.0
47"""