Python 3.8.5でpandasを使って、データの集計を行いたい

前提・実現したいこと

Python 3.8.5でpandasを使って、データの集計を行う
複数行を、特定の列(state)でgroupして、pointを集計したいが、
特定の列(state)に特定文字(JAPAN)を含むレコードは、同一のレコードとみなしてgroup化したい

該当のソースコード

import pandas as pd
df = pd.read_csv('C:\0128\raw\raw.csv')
print(df[df['state'].str.contains('JAPAN')])

このように集計したい

name,age,state,point
Alice,24,JAPAN,100
Bob,42,CANADA,92
Charlie,18,AMERICA,70
Dave,68,JAPANESE,100
Ellen,24,JAPANESE,100
Frank,30,FRANCE,57

↓↓

state,point
JAPAN,300
CANADA,92
AMERICA,70
FRANCE,57

takutakuya

2021/01/28 15:52

JAPANとJAPANESEは同一とみなすんですか？

usaginote1020

2021/01/28 15:54

はい。JAPANという文字を含むものは同一とみなしたいです。

行動規範の内容に同意します

回答1件

ベストアンサー

Python
1import pandas as pd
2import io
3
4txt = """
5name,age,state,point
6Alice,24,JAPAN,100
7Bob,42,CANADA,92
8Charlie,18,AMERICA,70
9Dave,68,JAPANESE,100
10Ellen,24,JAPANESE,100
11Frank,30,FRANCE,57
12"""
13
14df = pd.read_csv(io.StringIO(txt))
15# df = pd.read_csv('C:\0128\raw\raw.csv')
16df.loc[df['state'].str.contains("JAPAN"), 'state'] = "JAPAN"
17dfg = pd.DataFrame(df.groupby('state')['point'].sum())
18print(dfg)

result
1         point
2state
3AMERICA     70
4CANADA      92
5FRANCE      57
6JAPAN      300

投稿2021/01/28 15:51

編集2021/01/28 15:54

Daregada

総合スコア11990

usaginote1020

2021/01/28 15:59

ありがとうございました。希望通りに出来ました

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

『🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中！

＼teratail特別グッズやAmazonギフトカード最大2,000円分が当たる！／

Python 3.8.5でpandasを使って、データの集計を行いたい

前提・実現したいこと

該当のソースコード

このように集計したい

関連した質問