回答編集履歴

2020/02/18 06:36

投稿

スコア21962

answer CHANGED Viewed

@@ -22,4 +22,18 @@
 # 3  11-Feb-2020 00:00  431  33  81.17%
 # 4  12-Feb-2020 00:00   21  12  63.64%
 # 5  13-Feb-2020 00:00  100  10  68.97%
+```
+## 追記
+単にグループごとの割合を見たいのであれば以下
+```python
+df2 = df.groupby("A").sum()["B"] / df["B"].sum()
+print(df2)
+# A
+# 11-Feb-2020 00:00    0.748942
+# 12-Feb-2020 00:00    0.046544
+# 13-Feb-2020 00:00    0.204513
+# Name: B, dtype: float64
 ```

2020/02/18 06:35

投稿

スコア21962

answer CHANGED Viewed

@@ -1,1 +1,25 @@
-間違いがあったので編集中
+以下のようになると思います。
+1. 列を指定してグルーピング df.groupby("A")
+2. transform("sum") でグループごとに合計を計算し、元の DataFrame に合わせる
+3. B 列をグループごとの合計で割ることでグループごとの割合を算出
+4. %表記にしたければ、float を文字列にフォーマット
+```python
+import pandas as pd
+import numpy as np
+df = pd.read_csv("sample.csv")
+# グループごとに割合を計算
+df["Share"] = df["B"] / df.groupby("A").transform("sum")["B"]
+# % 表記に変更
+df["Share"] = df["Share"].map(lambda x: '{:.2%}'.format(x))
+print(df)
+#                    A    B   C   Share
+# 0  11-Feb-2020 00:00  100  10  18.83%
+# 1  12-Feb-2020 00:00   12  22  36.36%
+# 2  13-Feb-2020 00:00   45  10  31.03%
+# 3  11-Feb-2020 00:00  431  33  81.17%
+# 4  12-Feb-2020 00:00   21  12  63.64%
+# 5  13-Feb-2020 00:00  100  10  68.97%
+```

2020/02/18 06:29

投稿

スコア21962

answer CHANGED Viewed

@@ -1,27 +1,1 @@
-「Bの行の値/B列の合計値でShareの列を追加」は質問のコードで問題ないと思います。
-実際、計算したあとに `df["Share"].sum()` を計算すると、合計はほぼ1になります。
-実際は、浮動小数点演算なので、厳密に1にはならず、`0.999999999999` のような値になります。
-##
-```python
-import pandas as pd
-# この質問からテーブルをとってくる
-df = pd.read_html("https://teratail.com/questions/242055", skiprows=1)[0]
-# 本題のコード
+間違いがあったので編集中
-df["Share"] = df["B"] / df["B"].sum()
-print(df["Share"].sum())  # 0.9999999999999999
-# % 表記に変更
-df["Share"] = df["Share"].map(lambda x: '{:.2%}'.format(x))
-print(df)
-#                    A    B   C   Share
-# 0  11-Feb-2020 00:00  100  10  16.67%
-# 1  12-Feb-2020 00:00  100  10  16.67%
-# 2  13-Feb-2020 00:00  100  10  16.67%
-# 3  11-Feb-2020 00:00  100  10  16.67%
-# 4  12-Feb-2020 00:00  100  10  16.67%
-# 5  13-Feb-2020 00:00  100  10  16.67%
-```

2020/02/18 06:18

投稿

スコア21962

answer CHANGED Viewed

@@ -7,8 +7,10 @@
 ```python
 import pandas as pd
+# この質問からテーブルをとってくる
 df = pd.read_html("https://teratail.com/questions/242055", skiprows=1)[0]
+# 本題のコード
 df["Share"] = df["B"] / df["B"].sum()
 print(df["Share"].sum())  # 0.9999999999999999