DataFrameを見て各週の一番小さいスコアを取り出したい

前提・実現したいこと

各calendarごとに持っている一番小さいscoreを出したい。
listsはスコア、listcにはカレンダーの値を入れていきたい。

発生している問題・エラーメッセージ

１．listsの中身のスコアがcalendarごとではなく全体で一番小さいscoreしか入らない。
(125,125)となる
２．listsは中身が３つならなければならないのに２つだけ。
３．listcに12が入っていない。
(13,14)となる

該当のソースコード

python3
1df = pd.DataFrame({calendar: [12,12,12,13,13,13,13,14,14,14,14,14],
2              score: [429,485,444,659,548,478,985,125,458,326,594,578],
3              hour: [15,14,12,13,14,15,18,17,19,19,10,17]
4              })
5
6
7
8s0 = 1000000#取りあえず大きい値を初期値にしている
9c0 = 12
10lists = list()
11listc = list()
12
13for c in df[calendar]:
14       
15        for s in df[score]:
16           
17            if c0==c and s0>=s:
18               s0 = s
19            elif c0!=c:            
20              lists.append(s0)
21              s0 = 1000000
22              c0 = c
23              listc.append(c0)

calendar	score	hour
12	492	15
12	485	14
12	444	12
13	659	13
13	548	14
13	478	15
13	985	18
14	125	17
14	458	19
14	326	19
14	594	10
14	578	17

補足情報

もしできるのでしたら各carendarの一番小さいscoreが出た時のhourもわかるようになればうれしいです。

行動規範の内容に同意します

回答1件

ベストアンサー

多分、やろうとしていることは DataFrame.groupby('calender') にてループすることで解決するかと思います。

Python
1import pandas as pd
2
3df = pd.DataFrame({
4    'calendar': [12,12,12,13,13,13,13,14,14,14,14,14],
5    'score': [429,485,444,659,548,478,985,125,458,326,594,578],
6    'hour': [15,14,12,13,14,15,18,17,19,19,10,17]
7})
8
9print(df.loc[df.groupby('calendar')['score'].idxmin()])
10
11
12lists = []
13listc = []
14for idx, d in df.groupby('calendar'):
15    lists.append(d['score'].min())
16    listc.append(d.loc[d['score'].idxmin(), 'hour'])
17
18print(lists)
19#[429, 478, 125]
20print(listc)
21#[15, 15, 17]

個人的には、ループを使ってリストに値を入れるのではなく、もとのDataFrameより、Scoreが最小でフィルタリングして

Python
1import pandas as pd
2
3df = pd.DataFrame({
4    'calendar': [12,12,12,13,13,13,13,14,14,14,14,14],
5    'score': [429,485,444,659,548,478,985,125,458,326,594,578],
6    'hour': [15,14,12,13,14,15,18,17,19,19,10,17]
7})
8
9print(df.loc[df.groupby('calendar')['score'].idxmin()])
10#   calendar  hour  score
11#0        12    15    429
12#5        13    15    478
13#7        14    17    125