回答編集履歴

2024/10/15 03:25

投稿

スコア21745

answer CHANGED Viewed

@@ -1,9 +1,9 @@
 > 2系の仕様でgroupbyとapply関数を用いてグループ別の割合を算出する方法
-`groupby()` の結果、multi-index になっていて、`reset_index(drop=True)` で元のインデックスを削除してしまっています。なので、グループインデックス(`male`, `female`)のみを削除することで元のインデックスに合わせて `rate` 列を作成します。
+`groupby()` の結果、multi-index になっていて、`reset_index(drop=True)` で元のインデックスを削除してしまっています。なので、グループインデックス(`male`, `female`)を作成しない様にすればよいかと思います。（`group_keys=False` を指定）
 ```python
-df["rate"] = df.groupby("sex")["fare"].apply(lambda x: x/x.sum()).reset_index(level=0, drop=True)
+df["rate"] = df.groupby("sex", group_keys=False)["fare"].apply(lambda x: x/x.sum())
 print(df.groupby("sex")["rate"].sum())

2024/10/15 03:16

投稿

スコア21745

answer CHANGED Viewed

@@ -1,6 +1,6 @@
 > 2系の仕様でgroupbyとapply関数を用いてグループ別の割合を算出する方法
-`groupby()` の結果、multi-index になっていて、`reset_index(drop=True)` で元のインデックスを削除してしまっています。なので、グループインデックス(`male`, `female`)のみを削除することで元のインデックスの合わせて `rate` 列を作成します。
+`groupby()` の結果、multi-index になっていて、`reset_index(drop=True)` で元のインデックスを削除してしまっています。なので、グループインデックス(`male`, `female`)のみを削除することで元のインデックスに合わせて `rate` 列を作成します。
 ```python
 df["rate"] = df.groupby("sex")["fare"].apply(lambda x: x/x.sum()).reset_index(level=0, drop=True)