以下のようなデータフレームがあります。
df = id choice date time q1 q2 a 2 2019/09/02 09:00 AM 9 7 a 2 2019/09/02 10:00 AM 9 7 b 1 2019/09/02 11:00 AM 1 4 a 9 2019/09/02 12:00 PM 9 7 a 2 2019/09/02 01:00 PM 9 7
:
これを
df_new = id date q1 q2 09:00 AMchoice 10:00 AMchoice 11:00 AMchoice 12:00 PMchoice 01:00 PMchoice a 2019/09/02 9 7 2 2 nan 9 2 b 2019/09/02 1 4 nan nan 1 nan nan
のように集計したいと考えております。
(同一IDでtime列を基準に新しい列を日ごとに展開)
df_merge['09:00 AMchoice'] =
df_merge['10:00 AMchoice'] =
df_merge['11:00 AMchoice'] =
df_merge['12:00 PMchoice'] =
df_merge['01:00 PMchoice'] =
df_merge['02:00 PMchoice'] =
df_merge['03:00 PMchoice'] =
df_merge['04:00 PMchoice'] =
df_merge['05:00 PMchoice'] =
df_merge['06:00 PMchoice'] =
のように列は追加できると思うのですが、うまく特徴量エンジニアリングできずに困っております。
ご教示頂けますと幸いです。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。