編集履歴

回答編集履歴

2020/08/26 07:04

投稿

スコア1399

answer CHANGED Viewed

@@ -24,4 +24,41 @@
 # 1  3  300  400
 # 2  2  500  600
 # 2  2  500  600
+```
+---
+なお、`df1`のインデックスが重複している場合や、より高速な処理を求める場合は以下の方法で
+```python
+import numpy as np
+df1 = pd.DataFrame({'n': [2, 3, 2],
+                    'a': [100, 300, 500],
+                    'b': [200, 400, 600]},
+                    index=[1, 2, 1])
+df1.loc[df1.index.repeat(df1['n'])]  # インデックスが重複していると結果が正しくない
+#    n    a    b
+# 1  2  100  200
+# 1  2  500  600
+# 1  2  100  200
+# 1  2  500  600
+# 2  3  300  400
+# 2  3  300  400
+# 2  3  300  400
+# 1  2  100  200
+# 1  2  500  600
+# 1  2  100  200
+# 1  2  500  600
+df1.iloc[np.repeat(np.arange(len(df1)), df1['n'].to_numpy())]  # 正しく、かつ高速
+#    n    a    b
+# 1  2  100  200
+# 1  2  100  200
+# 2  3  300  400
+# 2  3  300  400
+# 2  3  300  400
+# 1  2  500  600
+# 1  2  500  600
 ```