編集履歴

回答編集履歴

edit

2018/04/15 13:41

投稿

スコア8562

answer CHANGED Viewed

@@ -38,12 +38,13 @@
 ---
-比較。
+比較。（更新：groupby, numpy.where, backward, forward）
 ```python
 from itertools import groupby
+import numpy as np
 import random
 from contextlib import contextmanager
 import time
 @contextmanager
 def timer(name):
@@ -51,43 +52,45 @@
     yield
     print(f'[{name}] done in {time.time() - t0:.5f} s')
-slen = 1000
+slen = 1300
-tslen = 1200
+tslen = 1500
-N = 1000
+N = 10000
+ss = []
+for _i in range(N):
-random.seed(0)
+    random.seed(_i)
-s_org = [1]*(tslen-slen) + [random.randint(0, 1) for _ in range(1000)]
+    s_ = np.array([1]*(tslen-slen) + [random.randint(0, 1) for _ in range(slen)])
+    ss.append(s_)
 with timer('groupby'):
+    mm0 = []
-    for _ in range(N):
+    for _i in range(N):
-        s = map(str, s_org)
+        s = ss[_i]
         ans = [len(list(g)) for k, g in groupby(s)]
         m = max(ans[::2])
+        mm0.append(m)
+with timer('numpy.where'):
-        m0 = m
+    mm1 = []
+    for _i in range(N):
+        a = ss[_i]
+        offset = 1
+        diff_a = a[offset:] - a[:-offset]
-with timer('forward-search'):
+        pos1to0 = np.where(diff_a ==-1)[0] + offset
-    s = s_org
-    for _ in range(N):
+        pos0to1 = np.where(diff_a ==+1)[0] + offset
-        m = 0
-        c = 0
-        for v in s:
-            if v == 1:
-                c += 1
-            else:
-                if c > m:
-                    m = c
-                c = 0
-        if c > m:
-            m = c
-        m1 = m
+        pos0to1 = np.append([0], pos0to1)
+        m = (pos1to0 - pos0to1[:len(pos1to0)]).max()
+        mm1.append(m)
 with timer('backward-search'):
     def forward_search(s):
         j = 0
         while j < len(s) and s[j] == 1:
             j += 1
         return j
     def backward_search(s, m):
         if m >= len(s):
             return False, len(s), 0
@@ -95,7 +98,9 @@
         c = forward_search(t)
         return True, m, c
+    mm2 = []
-    for _ in range(N):
+    for _i in range(N):
+        s = ss[_i]
         m = 0
         i = forward_search(s)
         m = i
@@ -108,10 +113,28 @@
                 i += j
                 if c > m:
                     m = c
+        mm2.append(m)
+with timer('forward-search'):
+    mm3 = []
+    for _i in range(N):
+        s = ss[_i]
-        m2 = m
+        m = 0
+        c = 0
+        for v in s:
+            if v == 1:
+                c += 1
+            else:
+                if c > m:
+                    m = c
+                c = 0
+        if c > m:
+            m = c
+        mm3.append(m)
-assert m0 == m1
+assert np.all(mm0 == mm1)
-assert m1 == m2
+assert np.all(mm0 == mm2)
+assert np.all(mm0 == mm3)
 ```
 ---

edit

2018/04/15 13:41

投稿

mkgrei

スコア8562

answer CHANGED Viewed

@@ -145,4 +145,8 @@
 Pythonでそれをやるのは少しちぐはぐ感が残ってしまいます。
 C++などで書き換えるだけで、もとのアルゴリズムで高速に処理できることが見込まれるためです。
+（重複するようなケースが出現する場合、キャッシュをうまく使うことも重要です。
+https://pypi.python.org/pypi/fastcache/0.4.3
+メモリと演算のバランスをチューニングするがよいコード書くために大切です。）
 高速化することも大事ですが、楽して高速化することも大事です。

edit

2018/04/15 06:07

投稿

mkgrei

スコア8562

answer CHANGED Viewed

@@ -112,4 +112,37 @@
 assert m0 == m1
 assert m1 == m2
-```
+```
+---
+雑談
+高速化を行う際には、
+1. アルゴリズムの改良
+2. コーディングの改良
+に分けて考えるとスッキリします。
+今回の場合、最低でもO(N)で各ピクセルを見ないと答えが出ないような問題です。
+すると、探索の打ち切りの可能性を検討した後、コーディングの改良を検討します。
+（目的とあっていない可能性がありますが、
+最長の1の塊を探索するのであれば、最長になりえない領域をできるだけスキップする作戦を考えます。）
+次に書き方を工夫します。
+（ブロック化してSIMD命令を利用するのが、C++などのコンパイル言語を使う際に検討する必要があります。）
+Pythonの場合、numpy、opencvのライブラリを出来る限り利用できるようにするのが近道です。
+すると、numpyのメソッド、opencvのメソッド、pythonのbuilt-inメソッドを使用することを検討すべきです。
+一個ずつピクセルを見ていくより、ベクトルとみなしてsumが速いことは予想できます。
+ならば、sumだけで済むように前処理を検討するのが良さそうです。
+opencvのオープニングを使うことで先にノイズを消してから、sumを行うのが一番速そうです。
+他にもバイナリとして扱ってビット演算を用いることで高速化することも考えられます。
+Pythonでそれをやるのは少しちぐはぐ感が残ってしまいます。
+C++などで書き換えるだけで、もとのアルゴリズムで高速に処理できることが見込まれるためです。
+高速化することも大事ですが、楽して高速化することも大事です。

edit

2018/04/15 06:01

投稿

mkgrei

スコア8562

answer CHANGED Viewed

@@ -34,4 +34,82 @@
 1100001 1000001 ...
 1000010 0111110 ...
 ...
+```
+---
+比較。
+```python
+from itertools import groupby
+import random
+from contextlib import contextmanager
+import time
+@contextmanager
+def timer(name):
+    t0 = time.time()
+    yield
+    print(f'[{name}] done in {time.time() - t0:.5f} s')
+slen = 1000
+tslen = 1200
+N = 1000
+random.seed(0)
+s_org = [1]*(tslen-slen) + [random.randint(0, 1) for _ in range(1000)]
+with timer('groupby'):
+    for _ in range(N):
+        s = map(str, s_org)
+        ans = [len(list(g)) for k, g in groupby(s)]
+        m = max(ans[::2])
+        m0 = m
+with timer('forward-search'):
+    s = s_org
+    for _ in range(N):
+        m = 0
+        c = 0
+        for v in s:
+            if v == 1:
+                c += 1
+            else:
+                if c > m:
+                    m = c
+                c = 0
+        if c > m:
+            m = c
+        m1 = m
+with timer('backward-search'):
+    def forward_search(s):
+        j = 0
+        while j < len(s) and s[j] == 1:
+            j += 1
+        return j
+    def backward_search(s, m):
+        if m >= len(s):
+            return False, len(s), 0
+        t = s[m::-1]
+        c = forward_search(t)
+        return True, m, c
+    for _ in range(N):
+        m = 0
+        i = forward_search(s)
+        m = i
+        while i < len(s):
+            fforward, j, c = backward_search(s[i:], m)
+            i += j
+            if fforward:
+                j = forward_search(s[i:])
+                c += j
+                i += j
+                if c > m:
+                    m = c
+        m2 = m
+assert m0 == m1
+assert m1 == m2
 ```

edit

2018/04/15 05:24

投稿

mkgrei

スコア8562

answer CHANGED Viewed

@@ -27,10 +27,11 @@
 ブロック分けしてdivide-and-conquerでもよいですが。
 ```
-↓    ↓
+↓    ↓↓　　↓
-0000001
+0000001 0111011 ...
-0000010
+0000010 1111011 ...
-1000010
+1000010 0000000 ...
-1100001
+1100001 1000001 ...
-1000010
+1000010 0111110 ...
+...
 ```

edit

2018/04/12 14:22

投稿

mkgrei

スコア8562

answer CHANGED Viewed

@@ -20,4 +20,17 @@
 後はデータの性質に依存します。
 `01010101010101010101010101010`のように並んでいるのであれば判定が必要な分遅くなります。
-`11111111110000011100000000011`のようであれば、大幅に探索を減らすことができます。
+`11111111110000011100000000011`のようであれば、大幅に探索を減らすことができます。
+---
+ブロック分けしてdivide-and-conquerでもよいですが。
+```
+↓    ↓
+0000001
+0000010
+1000010
+1100001
+1000010
+```