回答率: 85.31%

質問するログイン新規登録

トップ NumPyに関する質問 Numpyブロードキャストのテクニックについて

編集履歴

回答編集履歴

2

修正

2020/03/19 08:00

投稿

スコア21960

test CHANGED Viewed

@@ -96,11 +96,19 @@
 import timeit
+import numpy as np
 from numba import jit
+np.random.seed(0)
+X = np.random.randint(0, 9, (20, 15, 13, 10, 10))
+Y = np.random.randint(0, 9, (9, 10, 10))

1

修正

2020/03/19 08:00

投稿

スコア21960

test CHANGED Viewed

@@ -75,3 +75,99 @@
 要素数は変わらないので、メモリ使用量は増えないと思います。
+# 追記
+質問のループバージョンのコードを numba で最適化したところ、
+218ms が 8.45 ms と25倍程度高速化できました。
+ブロードキャストで計算したバージョンが 8.01 ms なのでほぼ同じぐらいの速度が出るようになりました。
+```python
+import timeit
+from numba import jit
+def calc1(X, Y):
+    # broadcast バージョン
+    X = np.expand_dims(X, axis=3)
+    Z = np.max(X * Y, axis=(-2, -1))
+def calc2(X, Y):
+    # for-loop バージョン
+    Z = np.zeros((X.shape[0], X.shape[1], X.shape[2], Y.shape[0]), dtype=X.dtype)
+    for a in range(X.shape[0]):
+        for b in range(X.shape[1]):
+            for c in range(X.shape[2]):
+                for f in range(Y.shape[0]):
+                    Z[a, b, c, f] = np.max(X[a, b, c] * Y[f])
+@jit(nopython=True)
+def calc3(X, Y):
+    # for-loop バージョンに numba でコンパイルしたバージョン
+    Z = np.zeros((X.shape[0], X.shape[1], X.shape[2], Y.shape[0]), dtype=X.dtype)
+    for a in range(X.shape[0]):
+        for b in range(X.shape[1]):
+            for c in range(X.shape[2]):
+                for f in range(Y.shape[0]):
+                    Z[a, b, c, f] = np.max(X[a, b, c] * Y[f])
+# Jupyter Notebook 上で計測
+%timeit calc1(X, Y)
+%timeit calc2(X, Y)
+%timeit calc3(X, Y)
+# 8.01 ms ± 239 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
+# 218 ms ± 32.9 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
+# 8.45 ms ± 25.3 µs per loop (mean ± std. dev. of 7 runs, 1 loop each)
+```