質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
DateTime

多くのプログラミング言語におけるDateTimeオブジェクトは、日付と時間に関する演算と出力を行います。

GROUP BY

GROUP BYとはSQL文のひとつで、SELECT文において特定の列の値が等しい行ごとに表をグループ化します。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

1回答

462閲覧

Datetimeでのresampleがうまくいかない

osakanatengoku

総合スコア6

DateTime

多くのプログラミング言語におけるDateTimeオブジェクトは、日付と時間に関する演算と出力を行います。

GROUP BY

GROUP BYとはSQL文のひとつで、SELECT文において特定の列の値が等しい行ごとに表をグループ化します。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2023/01/19 18:54

編集2023/01/19 21:56

前提

csvファイルに格納してある5分毎のデータを1時間ごとに集計(和)をpythonで計算し,別のcsvファイルに出力したいです.
groupbyとresampleを使っていて,エラーは出ませんが結果が正しくないです.

実現したいこと

正しく集計すること

発生している問題・エラーメッセージ

ファイルは出力されたのですが,元データと比較したときに数値が合わないです.
元データのある地点の最初の1時間の値は,25,3,32,20,29,29,23,55,36,39,52,88で計431ですが,計算された出力ファイルでは241になっています.5分毎のデータをresampleで1時間で計算してはいけないのでしょうか.
奇数行のみ,偶数行のみを計算しても241にはなりませんでした.(197,234)

該当のソースコード

python3.10

1 df = df[['時刻', '地点', '観測値']] 2 df['時刻'] = pd.to_datetime(df['時刻'], format="%Y/%m/%d %H:%M:%S") 3 df.set_index('時刻', inplace=True) 4 df_concat = pd.DataFrame() 5 for _, _df in df.groupby('地点'): 6 _df = _df.resample('1H').sum() 7 df_concat = pd.concat([df_concat, _df])

試したこと

ここに問題に対して試したことを記載してください。

補足情報(FW/ツールのバージョンなど)

ここにより詳細な情報を記載してください。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

melian

2023/01/19 20:42

df.set_index('時刻', inplace=True) の直後に、 df_concat = df.groupby('地点', sort=False).resample('1H').sum() を実行すると df_concat 値はどうなりますか?
osakanatengoku

2023/01/19 21:32

ありがとうございます!うまくいきました! インデックスが入れ子になったんですが,csvに書き込む分には問題なかったのでこれで大丈夫です. (インデックスと列に'地点'ができてしまったんですが,列のほうをdropで落として出力して,ほしい3つの列のcsvができました.)
osakanatengoku

2023/01/19 21:53

どうしてうまくいかなかったのか,とても気になります... 余裕がありましたらなぜなのか教えていただけると嬉しいです...
meg_

2023/01/20 00:11

解決されたようですので質問のクローズ処理をお願いします。
melian

2023/01/20 01:24

おそらくですが、groupby('地点', sort=False) に原因があるのかな、と思います。「地点」をキーにしてソートする(sort=True, デフォルト値)か、しない(sort=False)かを指定しています。この指定で最終的な出力の順序が変わります。
guest

回答1

0

自己解決

原因は分かりませんが,groupbyの引数に sort=False を指定するとうまくいきました.
ファイルが大きいのソートするとよくなかったのかもしれないです.

投稿2023/01/20 07:33

osakanatengoku

総合スコア6

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問