前提・実現したいこと
以下のようなデータフレームから、①生徒ごと(=行ごと)の成績の合計値と②科目ごと(=列ごと)の合計値を出したいと思っています。
引数のaxisについて、0や1ではなく、'index'や'columns'と文字列で指定するようにしているのですが(うろ覚えによる間違いを防ぐため)、
何度試してもaxis='index'の時に列ごとの合計値を、axis='columns'の時に行ごとの合計値が算出されてしまいます。
pandasのsum関数の時は引数は文字列ではなく0か1で指定しないとうまく動作しないのでしょうか?
該当のソースコード
Python
1import pandas as pd 2 3df2 = pd.read_csv('data.csv') 4df2 = df2.drop(['class'], axis='columns') 5print('生徒ごと', df2.sum(axis='index')) 6#生徒ごと name ABCDEFGHBD 7#English 677 8#Mathmatics 738 9#History 774 10 11print('科目ごと',df2.sum(axis='columns')) 12#科目ごと 0 200 13#1 238 14#2 230 15#3 173 16#4 237 17#5 242 18#6 237 19#7 221 20#8 238 21#9 173
試したこと
axis=0, axis=1で指定した時は期待通りの動作をしました。
補足情報(FW/ツールのバージョンなど)
pandasのバージョンは1.1.5で、google colabを使用しています。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/04/14 06:21