要素ごとに全体の個数、特定条件の個数を数えてその割合を計算させたい

前提・実現したいこと

Python初心者です。現在excelファイルをソースにデータ処理を行っております。
添付写真のようなデータをもとに、最終的にはNameごとに
①全Outcome数
②Outcome行の"Strike","In Play","Error"の個数の合計
③全Outcome数に対する②の個数の％

以上3点を出力したいと考えております。

発生している問題・エラーメッセージ

AttributeError: 'tuple' object has no attribute 'sum'

該当のソースコード

Python
1df_b=df.groupby("Name")["Outcome"].apply(lambda x:(x=="Strike","In Play","Error").sum()).reset_index(name="count")
2df_b
3

試したこと

まだ序盤ですが躓いております。x==の完全一致のところは、例えば"Strike"のみであればエラーは発生しませんでした。sum関数の特性？なのかなと思いますが、そのほかの方法含めご教示の程お願い致します。

補足情報（FW/ツールのバージョンなど）

vsCodeを使用しております。

行動規範の内容に同意します

回答2件

ベストアンサー

集計はapplyでもできますが、aggの方がわかりやすいです。
あと、複数との一致を調べるにはisinを使います。

python
1df_b = df.groupby("Name")["Outcome"].agg(
2    count1='count',
3    count2=lambda s: s.isin(["Strike", "In Play", "Error"]).sum())
4df_b['ratio'] = df_b['count2'] / df_b['count1']

投稿2021/08/02 00:51

bsdfan

総合スコア4567

8960

2021/08/04 01:56

ありがとうございます！無事できました。

行動規範の内容に同意します

こういう感じです。

python
1>>> print(df)
2   Name Outcome  count
30   T    S       1
41   T    B       1
52   T    I       1
63   T    E       1
74   T    S       1
85   K    S       1
96   K    I       1
107   K    E       1
118   K    S       1
129   K    B       1
1310  K    B       1
14>>> df['count'] = 1
15>>> print(df.groupby("Name")['count'].sum())
16Name
17K    6
18T    5
19Name: count, dtype: int64
20>>> df2 = df.groupby(["Name", "Outcome"]).sum().reset_index()
21>>> df2['%'] = pd.concat([d['count']/d['count'].sum() for _, d in (df2.groupby("Name"))])
22>>> print(df2)
23  Name Outcome  count  %
240  K    B       2      0.333333
251  K    E       1      0.166667
262  K    I       1      0.166667
273  K    S       2      0.333333
284  T    B       1      0.200000
295  T    E       1      0.200000
306  T    I       1      0.200000
317  T    S       2      0.400000

投稿2021/08/01 04:38

ppaul

総合スコア24666

8960

2021/08/01 05:14

ご回答ありがとうございます！説明足らずでおりました。最終的な出力としては、「全outcome数に対する"Strike","In Play","Error"の個数の合計の割合」ですのでName一つにつき、一行のみの％で収まる感じですね。以下のような感じです。 Takahashi　5　4　80％ Kubo　　　6　4　6７％ . . .