前提
csvファイルに格納してある5分毎のデータを1時間ごとに集計(和)をpythonで計算し,別のcsvファイルに出力したいです.
groupbyとresampleを使っていて,エラーは出ませんが結果が正しくないです.
実現したいこと
正しく集計すること
発生している問題・エラーメッセージ
ファイルは出力されたのですが,元データと比較したときに数値が合わないです.
元データのある地点の最初の1時間の値は,25,3,32,20,29,29,23,55,36,39,52,88で計431ですが,計算された出力ファイルでは241になっています.5分毎のデータをresampleで1時間で計算してはいけないのでしょうか.
奇数行のみ,偶数行のみを計算しても241にはなりませんでした.(197,234)
該当のソースコード
python3.10
1 df = df[['時刻', '地点', '観測値']] 2 df['時刻'] = pd.to_datetime(df['時刻'], format="%Y/%m/%d %H:%M:%S") 3 df.set_index('時刻', inplace=True) 4 df_concat = pd.DataFrame() 5 for _, _df in df.groupby('地点'): 6 _df = _df.resample('1H').sum() 7 df_concat = pd.concat([df_concat, _df])
試したこと
ここに問題に対して試したことを記載してください。
補足情報(FW/ツールのバージョンなど)
ここにより詳細な情報を記載してください。
回答1件
あなたの回答
tips
プレビュー