今年(df1)
商品id | 商品名 | 販売日 | 数量 |
---|---|---|---|
002 | リンゴ | 20200101 | 10 |
004 | なし | 20200101 | 15 |
002 | リンゴ | 20200103 | 10 |
003 | メロン | 20200103 | 10 |
004 | なし | 20200103 | 10 |
002 | リンゴ | 20200105 | 10 |
003 | メロン | 20200105 | 10 |
004 | なし | 20200105 | 10 |
去年(df2)
商品id | 商品名 | 販売日 | 数量 |
---|---|---|---|
003 | メロン | 20190102 | 20 |
004 | リンゴ | 20190102 | 10 |
001 | いちご | 20190103 | 30 |
002 | いちご | 20190103 | 10 |
集計(df3)
商品id | 商品名 |
---|---|
001 | いちご |
002 | リンゴ |
003 | メロン |
004 | なし |
005 | パイナップル |
最終イメージ
商品id | 商品名 | 今年数量 | 去年数量 |
---|---|---|---|
001 | いちご | 0 | 40 |
002 | リンゴ | 40 | 10 |
003 | メロン | 15 | 20 |
004 | なし | 40 | 0 |
005 | パイナップル | 0 | 0 |
「今年」と「去年」のデータがあり「集計」の商品id毎に数量を集計し今年と昨年の販売数量を入れて「最終イメージ」のようなデータを完成させたいです。「最終イメージ」のように集計した結果、販売数量がなければ0を表示させたいです。よろしくお願い致します。
import pandas as pd df1 = pd.DataFrame( data={'商品id':["002","004","002","003","004","002","003","004"], '商品名':["リンゴ","なし","リンゴ","メロン","なし","リンゴ","メロン","なし"], '販売日':[20200101,20200101,20200103,20200103,20200103,20200105,20200105,20200105], '数量':[10,15,10,10,10,10,10,10]}) df2 = pd.DataFrame( data={'商品id':["003","004","001","002"], '商品名':["メロン","リンゴ","いちご","いちご"], '販売日':[20190102,20190102,20190103,20190103], '数量':[20,10,30,10]}) df3 = pd.DataFrame( data={'商品id':["001","002","003","004","005"], '商品名':["いちご","リンゴ","メロン","なし","パイナップル"] })
使っているツールのバージョンなど補足情報
Windows10
python3.9 64bit
回答2件
あなたの回答
tips
プレビュー