pandas groupbyにおける抽出について

pandasにおける要素の抽出でご教授していただきたいです。

DataFrame  df
#       name  age state  month
# 0      Alice   24    NY     1
# 1      Bob   42    CA     1
# 2      Alice   18    CA     2
# 3      Alice   68    TX     3
# 4      Ellen   24    CA     3
# 5      Frank   30    NY     4
# 6     Alice   24    NY     4
# 7     Bob   42    CA     5
# 8     Alice   18    CA     6
# 9     Alice   68    TX     7
# 10   Alice   24    CA     8
# 11   Alice   30    NY     9
# 12  Alice   24    NY     10
# 13  Alice   42    CA     11
# 14  Alice   18    CA     11
# 15  Dave   68    TX     12
# 16  Alice   24    CA     12
# 17  Frank   30    NY     12

上記のようなデータがあった時、[列name]の[要素Alice]の数を[列month]ごとに抽出しているのですが、

df = df[df['name'] == 'Alice']
answer = df.groupby('Month').size()
answer
Month
1     1
2     1
3     1
4     1
6     1
7     1
8     1
9     1
10    1
11    2
12    1
dtype: int64

のように要素がないMonthは何も抽出されない為、[month]の５、が飛ばされています。
この場合に５　　０　のように要素がない時は０を入れて抽出したいのですが、なかなか答えにたどり着けません。。
初歩的な事かもしれませんが、お力添えしていていただけると助かります。

行動規範の内容に同意します

回答1件

ベストアンサー

存在しない値が集計されないのは、groupbyの目的上自然です。

望んでいる結果を得るためには、希望のインデックスのSeriesに変換する処理を自分で書く必要があります。といっても難しくはなく、単にreindexすればいいかと思います。

python
1answer = df.groupby('month').size().reindex(range(1, 13), fill_value=0)

参考：
python - Zero occurrences/frequency using value_counts() in PANDAS - Stack Overflow
pandas.Series.reindex — pandas 1.0.1 documentation

質問内容とは外れますが、今回の目的であればgroupbyよりはvalue_countsを使った方が良いかもしれません。そちらもご検討ください。

pandas.Series.value_counts — pandas 1.0.1 documentation

投稿2020/02/18 13:24

hayataka2049

総合スコア30935

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

pandas groupbyにおける抽出について

関連した質問