pandasによる日ごとの集計からの列追加について

以下のようなデータフレームがあります。

df = 

id	choice	date	time	q1	q2
a	2	2019/09/02	09:00 AM	9	7
a	2	2019/09/02	10:00 AM	9	7
b	1	2019/09/02	11:00 AM	1	4
a	9	2019/09/02	12:00 PM	9	7
a	2	2019/09/02	01:00 PM	9	7

：

これを

df_new = 
id	date	q1	q2	09:00 AMchoice	10:00 AMchoice	11:00 AMchoice	12:00 PMchoice	01:00 PMchoice
a	2019/09/02	9	7	2	2	nan	9	2
b	2019/09/02	1	4	nan	nan	1	nan	nan

のように集計したいと考えております。
（同一IDでtime列を基準に新しい列を日ごとに展開）

df_merge['09:00 AMchoice'] =
df_merge['10:00 AMchoice'] =
df_merge['11:00 AMchoice'] =
df_merge['12:00 PMchoice'] =
df_merge['01:00 PMchoice'] =
df_merge['02:00 PMchoice'] =
df_merge['03:00 PMchoice'] =
df_merge['04:00 PMchoice'] =
df_merge['05:00 PMchoice'] =
df_merge['06:00 PMchoice'] =

のように列は追加できると思うのですが、うまく特徴量エンジニアリングできずに困っております。
ご教示頂けますと幸いです。

行動規範の内容に同意します

回答2件

ありがとうございます！
pivotテーブルでしたね。もう少し直感的にpandasを操作できるようになりたいです。。

投稿2019/10/04 10:26

mi2

総合スコア63

ベストアンサー

こういう事でしょうか？

Python
1import pandas as pd
2import io
3
4data = """
5id,choice,date,time,q1,q2
6a,2,2019/09/02,09:00 AM,9,7
7a,2,2019/09/02,10:00 AM,9,7
8b,1,2019/09/02,11:00 AM,1,4
9a,9,2019/09/02,12:00 PM,9,7
10a,2,2019/09/02,01:00 PM,9,7
11"""
12
13df = pd.read_csv(io.StringIO(data))
14res = df.pivot_table(index=['id','date','q1','q2'], columns='time', values='choice')
15#time                 01:00 PM  09:00 AM  10:00 AM  11:00 AM  12:00 PM
16#id date       q1 q2
17#a  2019/09/02 9  7        2.0       2.0       2.0       NaN       9.0
18#b  2019/09/02 1  4        NaN       NaN       NaN       1.0       NaN