pythonでpd.mergeを使ってデータ結合をしたのですが、
データの行が重複してしまって、予期せぬ結合となってしまいました。
デシルランク分析を行い、TOPのユーザーに、商品売上を付与しようと思っています。
以下の二つのデータフレームのuser_idで結合を試みました。
①top_kokyaku
user_id 、amount、D_rank
②uriage_all
transaction_cd、item_nm_x、item_id、item_cnt、date、user_id、date_dt、month、item_nm_y、price、、item_category、amount
ただ、
添付のように、同じ商品が重複して行に並んでしまっているので、
売上が二重計上などが起きてしまっています。
結合の仕方が悪いのか、重複なく結合したいのですがどのようにしたらいいでしょうか。
python
1top_kokyaku = pd.merge(top_kokyaku,uriage_all,left_on='user_id',right_on='user_id',how='inner') 2top_kokyaku.head()
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/09/14 07:24