前提
分析用データの前処理をしているのですが、やりたい事が出来ず困っています。
初心者で恐縮ですが、ご教示いただけますと幸いです。
実現したいこと
縦持ち・重複ありのデータ(下記df参照)を
userでユニーク化し、
placeを横持ちして、カウントした値を入れたいです。
※最終的に実現したいアウトプット
user 京都 千葉 東京
A,1,0,1
B,0,2,0
C,0,0,1
該当のソースコード
Python
1import pandas as pd 2 3df = pd.DataFrame({'user': ['A', 'B', 'B', 'C', 'A'],'place': ['京都','千葉','千葉','東京','東京']}) 4 5tmp=pd.get_dummies(df['place']) 6 7pd.concat([df,tmp],axis=1).drop(columns=['place'])
試したこと
色々調べて上記コードで実行しましたが、
・ユーザーがユニーク化出来ていない
・placeのカウントが出来ていない
という事で、
ここから修正するためのヒント、もしくはget_dummiesではない適切な方法があれば教えて頂きたいです。
何卒、宜しくお願いいたします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2023/01/29 23:45