回答編集履歴

Numba追記

2021/12/16 03:37

投稿

スコア4963

answer CHANGED Viewed

@@ -21,4 +21,27 @@
 こういうのの高速化はnumbaのほうが良さそうなので、そちらも試してみましたが2倍程度しか速くなりませんでした。
+参考までにコードは下記の通りで、元のコードにjitをつけただけで試しています。(引数はndarrayである前提)
-もともと、それほど遅くなるようなforの使い方でもないように思います。
+もともと、それほど遅くなるようなforの使い方でもないように思います。
+```python
+from numba import jit
+@jit
+def _accuracy(preds, label, group):
+    BEST_LABEL = 2
+    i = 0
+    acc = 0
+    for n in group:
+        max = preds[i:i+n].argmax()
+        acc += (label[i+max] == BEST_LABEL)
+        i += n
+    return acc/len(group)
+def accuracy(preds, data):
+    label = data.get_label()
+    group = data.get_group()
+    return "accuracy", _accuracy(preds, label, group), True
+```

追記

2021/12/16 03:37

投稿

スコア4963

answer CHANGED Viewed

@@ -17,6 +17,8 @@
 ```
 手元のテストコードで、元のより1.5倍ちょっと早くなる程度でした。
+(`[0, *np.cumsum(group[:-1])]`が固定で、毎回計算する必要がないなら、この部分を外に出すともう少し速くできそうです)
 こういうのの高速化はnumbaのほうが良さそうなので、そちらも試してみましたが2倍程度しか速くなりませんでした。
 もともと、それほど遅くなるようなforの使い方でもないように思います。