pandasで時系列データをもとに、n秒ごとに行をまとめてそのまとめた行の列ごとに別々の処理を行いたいのですが、良い方法あるでしょうか?
例えばこの例のようなデータに対して3秒ごとにまとめ、priceは3秒内の最大値を求め、amountは3秒間の総和を求めるということがしたいです。
str_dateはインデックスではなく、指定していません。カラム名はstr_date, price, amountです。
str_date | price | amount |
---|---|---|
"2020-06-01 00:00:00" | 100 | 0.1 |
"2020-06-01 00:00:01" | 400 | 0.2 |
"2020-06-01 00:00:02" | 300 | 0.3 |
"2020-06-01 00:00:05" | 200 | 0.4 |
"2020-06-01 00:00:07" | 900 | 0.5 |
"2020-06-01 00:00:12" | 700 | 0.6 |
"2020-06-01 00:00:13" | 800 | 0.7 |
"2020-06-01 00:00:14" | 900 | 0.8 |
・3秒でサンプリング
str_date | price | amount |
---|---|---|
"2020-06-01 00:00:00" | 400 | 0.6 |
"2020-06-01 00:00:03" | 200 | 0.4 |
"2020-06-01 00:00:06" | 900 | 0.5 |
"2020-06-01 00:00:09" | NaN | NaN |
"2020-06-01 00:00:12" | 900 | 2.1 |
回答2件
あなたの回答
tips
プレビュー