グループ別に欠損値の数をカウントしたい。

以下の列で構成されるデータフレーム"df"（一部の列省略）があり、Group別にBirtdayの欠損値の数をカウントしたいです。お手数をおかけして恐れ入りますが、ご教示お願いします。
「dfの列」
GroupID,GroupName,personalID,Sex,Birthday,値（省略)

「これまでやったこと」
（１）df.isnull().sum()で欠損値の数が分かり、
（２）df.isnull().apply(lambda col: col.value_counts(),　axis=0).fillna(0).astype(np.float).apply(lambda col: col/col.sum(), axis=0)　で
列別の欠損値の割合が分かりました。特にbirthdayに欠損値の割合が高いです。

「今やりたいこと」
特定のGroupの場合に欠損値が集中している事を示したいです。
⇒実際には元ファイルを目視して分かりましたが、（特に今後件数が増えた場合に備えて）プログラミングの勉強として知りたいです。

「追記：対処したこと」
df2=df.groupby('GroupName').count()[['GroupID','Birthday']] で出し、
df2['GAP']=df2['GroupID']-df2['Birthday']
df2.sort_values('GAP',ascending=False)
で欠損値の数を比較しました。

行動規範の内容に同意します

回答2件

自己解決

df2=df.groupby('GroupName').count()[['GroupID','Birthday']] で出し、（GroupIDは全部あるので）割り算しました。
もっとスマートな方法がもしあればと思い、公開を継続しましたが、そろそろここでクローズさせて頂きます。
コメント頂いたppaul様、ありがとうございました。

投稿2021/02/06 07:13

Dantesu

総合スコア8

こんな感じです。

python
1>>> import pandas as pd
2>>> df=pd.DataFrame(
3...     {'GroupID':[1,1,1,1,1,1,2,2,2,2,2,3,3,3,3],
4...     'GroupName':['a', 'a', 'a', 'a', 'a', 'a', 'b', 'b', 'b', 'b', 'b', 'c', 'c', 'c', 'c'],
5...     'personalID':[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14],
6...     'Sex':['M', 'F', 'F', 'F', 'M', 'M', 'M', 'F', 'M', 'F', 'M', 'F', 'F', 'F', 'M'],
7...     'Birthday':[np.NaN,np.NaN,np.NaN,np.NaN,1,2,3,np.NaN,np.NaN,1,5,6,4,8,9],
8...     '値':[41, 53, 38, 58, 58, 38, 54, 57, 49, 50, 52, 59, 33, 34, 54]})
9>>>
10>>>
11>>> df2 = pd.concat([df['GroupName'],df['Birthday'].isnull()], axis=1).groupby('GroupName').mean()
12>>> print(df2)
13           Birthday
14GroupName
15a          0.666667
16b          0.400000
17c          0.000000