前提・実現したいこと
PythonのPandasを使ってエクセルデータの集計を行っています。
以下df1とdf2のデータにある商品IDをキーにして、販売数のみを足し合わせたdf3を作成したいと思っています。
python
1import pandas as pd 2df1 = pd.DataFrame([['A', 1, '飲料','1月1日'], ['B', 1, 'キッチン','1月2日'], ['C', 1, 'スポーツ','1月3日'],['D', 1, '食品','1月1日'],['E', 1, '雑貨','1月5日']],columns=['商品ID', '販売数', 'カテゴリ','発売日']) 3df2 = pd.DataFrame([['A', 1], ['C', 2], ['D', 3]],columns=['商品ID', '販売数',])
python
1df3 = pd.DataFrame([['A', 2, '飲料','1月1日'], ['B', 1, 'キッチン','1月2日'], ['C', 3, 'スポーツ','1月3日'],['D', 4, '食品','1月1日'],['E', 1, '雑貨','1月5日']],columns=['商品ID', '販売数', 'カテゴリ','発売日'])
「カテゴリ」と「発売日」はdf1を生かす形でconcatやmergeなどでgroupby.sum()を使用してみましたがうまくいかず…お知恵を貸していただけますでしょうか。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/03/09 14:00