回答率: 85.30%

質問するログイン新規登録

トップ Python 3.xに関する質問 1時間毎の集計を出したい

編集履歴

回答編集履歴

2

2024/09/11 13:44

投稿

スコア21274

answer CHANGED Viewed

@@ -7,7 +7,7 @@
          lambda y: pd.date_range(y['start'], y['end'], freq='H'), axis=1)
                      .explode().value_counts(sort=False).to_frame('count')
                      .reset_index(names='datetime'), include_groups=False)\
-       .droplevel(1, axis=0).reset_index()
+       .reset_index()
 df['datetime'] = df['datetime'].dt.round('H')
 df = df.drop_duplicates(['id', 'datetime'])
 df = df[['datetime', 'count']].groupby('datetime').sum()

1

2024/09/11 13:36

投稿

スコア21274

answer CHANGED Viewed

@@ -1,6 +1,6 @@
 > 同時刻内にユーザが重複しても、カウントされないようにしたいです。
-id 毎にカウントする様にして(`groupby()`)、id と時刻で重複列を取り除く様にしてみてはどうでしょうか。
+id 毎にカウントする様にして(`groupby()`)、id と時刻で重複列を取り除く様にして(`drop_duplicates()`)みてはどうでしょうか。
 ```python
 df = df.sort_values('start')
 df = df.groupby('id').apply(lambda x: x.apply(