[Python] pandasを使って、特定の列と列の合計値が最大の行を取ってきたいです、、、

Pythonである数字の一覧であるCSVファイルの中身に対して、特定の列と列の合計値が最大になる行を取ってきたいです。具体的には、テストとして以下のようなCSVファイルとコードを考えています。

<具体的にやりたいこと>
列名[A,B,C,D,E,F]の4行×6列のCSVファイルに対して、B列とC列の合計値が最大となる行を取得したいと思っています。

<sample.csv>
[A,B,C,D,E,F]
1,3,7,4,7,9
2,9,6,3,5,1
1,1,1,2,9,5
2,4,2,0,6,1

python3
1import pandas as pd
2
3# それぞれの列名を[A,B,C,D,E,F]にする。
4df = pd.read_csv('sample.csv', names=['A', 'B', 'C', 'D', 'E', 'F'])
5# 「B+C」列の合計値が最大値を取得
6x = (df['B + C'].max())
7# xが存在する行名を取得
8result = df.query('B + C == @x').index[0]

上記のコードを考えていましたが、上手くいきません。
どう書き換えればよいか、わかる方がいらっしゃいましたら教えていただけたら幸いです。よろしくお願いします。

行動規範の内容に同意します

回答2件

B列とC列の合計値が最大となる行が複数ある場合を考慮すると、以下のようなコードでも実現できます。

Python
1import pandas as pd
2from io import StringIO
3
4s = """A,B,C,D,E,F
51,3,7,4,7,9
62,9,6,3,5,1
71,1,1,2,9,5
82,4,2,0,6,1
90,9,6,0,0,0"""
10df = pd.read_csv(StringIO(s))
11
12bc = df['B'] + df['C']
13max = bc.max()
14
15ret = df[ bc == max]
16print(ret)
17#   A  B  C  D  E  F
18#1  2  9  6  3  5  1
19#4  0  9  6  0  0  0

投稿2020/02/02 11:20

8524ba23

総合スコア38341

player31

2020/02/03 09:50

回答ありがとうございます！たしかに最大値が複数ある場合を考えていませんでした。ベストアンサーに出来なくて、すみません。とても分かりやすく、参考になりました！

行動規範の内容に同意します

ベストアンサー

df["B"] + df["C"] で B列、C列を足した Series を作成し、idxmax() で値が最大の要素のインデックスを取得すればよいと思います。

pandas.Series.idxmax — pandas 1.0.0 documentation

python
1import pandas as pd
2
3df = pd.read_csv("sample.csv", names=["A", "B", "C", "D", "E", "F"])
4
5idx = (df["B"] + df["C"]).idxmax()  # 値が最大の行のインデックスを取得
6row_with_maxval = df.loc[idx]  # 値が最大の行
7print(row_with_maxval)