回答編集履歴
1
実行時間計測
test
CHANGED
@@ -28,3 +28,9 @@
|
|
28
28
|
'freq': freq[idx1, idx2]
|
29
29
|
})
|
30
30
|
```
|
31
|
+
google colab上で、group数 3,000, person数 50,000, df行数 約1,000,000 のデータを作ってみて試したところ、以下の時間でした。
|
32
|
+
sparseを使うのが有効そうです。
|
33
|
+
sparse使用 : 1.98秒
|
34
|
+
sparseなし : 25.5秒
|
35
|
+
ベストアンサー : 90.0秒
|
36
|
+
sparseなし(int) : 数分まっても終わらず
|