前提・実現したいこと
以下のようなdataframeがあります。
インデックスの0から2は00:00:00、3から5は00:05:00、6から8は00:10:00の値です。
それぞれの時間において、item_a、item_b、item_cが存在し、値があります。
やりたいことは、各時間におけるitem_a、item_b、item_cの合計値を出し、どの時間帯の値(合計値)が最も高かったかを出したいです。
例えば、00:05:00のitem_a、item_b、item_cの合計値が他の時間に比べて最も高ければ、00:05:00とその時のitem_a、item_b、item_cの値と合計値を出したいです。
よろしくおねがいします。
df = pd.DataFrame({ 'time': ['2020-09-16 00:00:00', '2020-09-16 00:00:00', '2020-09-16 00:00:00', '2020-09-16 00:05:00', '2020-09-16 00:05:00', '2020-09-16 00:05:00', '2020-09-16 00:10:00', '2020-09-16 00:10:00', '2020-09-16 00:10:00'], 'item_name': ['item_a', 'item_b', 'item_c', 'item_a', 'item_b', 'item_c', 'item_a', 'item_b', 'item_c'], 'value': [10, 5, 20, 10, 5, 20, 20, 10, 5]})
出力結果
time item_name value 0 2020-09-16 00:00:00 item_a 100 1 2020-09-16 00:00:00 item_b 5 2 2020-09-16 00:00:00 item_c 20 3 2020-09-16 00:05:00 item_a 10 4 2020-09-16 00:05:00 item_b 5 5 2020-09-16 00:05:00 item_c 20 6 2020-09-16 00:10:00 item_a 20 7 2020-09-16 00:10:00 item_b 10 8 2020-09-16 00:10:00 item_c 5
補足情報(FW/ツールのバージョンなど)
・CentOS7
・Python 3.8.3
・pandas 1.0.5
回答1件
あなたの回答
tips
プレビュー