[Python]Dataframeのデータを10分単位で年代別に集計したい

前提

Dataframeのデータを10分単位で年代別に集計したい

実現したいこと

・データを10分単位で集計する
・同じdailyIDは10分ごとに一回カウント
・集計は年代別

発生している問題・エラーメッセージ

年代別に集計する前に、10分毎に一意のdailyIDをカウント出来るか試したところ、10分間のデータ数になってしまいました。

該当のソースコード

Python
1df = pd.DataFrame({
2    'year' : [2021, 2021, 2021, 2021, 2021, 2021,2021,2021,2021,2021],
3    'month' : [8,8,8,8,8,8,8,8,8,8],
4    'day' : [1,1,1,1,1,1,1,1,1,1,],
5    'hour': [0,0,0,0,0,0,0,0,0,0],
6    'minute' : [1,1,2,4,7,17,2,4,9,16],
7   'dailyid': ['A', 'D','A', 'B','A', 'E','C','A', 'E','C'],
8   'age': ['10-19', '20-29','10-19', '30-39','10-19', '10-19','30-39','10-19','10-19','30-39']
9    },)
10
11#datatime作成
12df['日付'] = pd.to_datetime(df['year'].astype(str)+'-'+ df['month'].astype(str)+'-'+ df['day'].astype(str)+'　'+ df['hour'].astype(str)+':'+ df['minute'].astype(str))
13#必要ない列削除
14df = df.drop(columns=['year','month','day','hour','minute'])
15#列入れ替え
16df2 = df.loc[:,['日付', 'dailyid']]
17#日付でグループ
18df2.groupby(['日付'])['dailyid'].unique()
19#10分毎にカウント
20df2.groupby(pd.Grouper(key='日付', freq='10min')).count()

補足情報（FW/ツールのバージョンなど）

[現状]

|日付|dailyID|
|2021-08-01 00:00:00|8|
|2021-08-01 00:10:00|2|

↓
[理想]

|日付|dailyID|
|2021-08-01 00:00:00|3|
|2021-08-01 00:10:00|2|

[最終目標]

|日付|10-19|20-29|30-39|
|2021-08-01 00:00:00|2|1|2|
|2021-08-01 00:10:00|1|0|1|

Python初心者のため、分かりにくく大変恐縮なのですが、10分毎に一意のIDのカウント方法を教えて下さい。出来れば年代別のカウント方法までご教授いただけますと幸いです。

行動規範の内容に同意します

回答1件

ベストアンサー

一意のIDのカウントには、nunique を使います。
https://pandas.pydata.org/docs/reference/api/pandas.core.groupby.DataFrameGroupBy.nunique.html
dailyid についてカウントしたいので、['dailyid'] で列を選んでから、nunique() します。

python
1df2 = df.groupby(pd.Grouper(key='日付', freq='10min'))['dailyid'].nunique()

年代別に集計したいなら、groupby に age 列もいれて集計します。
その結果を unstack() すれば望みの形にできます。

python
1df2 = df.groupby([pd.Grouper(key='日付', freq='10min'), 'age'])['dailyid'].nunique()
2df2 = df2.unstack(fill_value=0)

(最終目標と 30-39 列の値が違うので、やりたいことと微妙に違うのかもしれないですが)

投稿2022/11/14 23:46

bsdfan

総合スコア4668

Kurogoma

2022/11/17 15:40

ありがとうございます！

Kurogoma

2022/11/22 13:14

すみません、値が違うのは自分が間違えていただけでした。ありがとうございました、無事に出来ました。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.41%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！