numpyの連続した数値列のカウント

Question

python初心者です
二値化した画像(.jpg)を配列に入れました
配列が

[1 1 1 1 1 1 1 1 0 1 0 0 0 0 0]
[1 1 1 1 1 1 1 1 0 0 0 0 0 0 0]
[1 1 1 1 1 1 1 1 1 1 0 0 0 0 0]

のようになっているとき，連続した1の数をカウントするソースコードを教えていただきたいです
1の数を数えるソースコードは調べれば出てくるのですが、連続した数字を数えるソースコードは出てきません


よろしくお願いいたします

実際には画像ファイルが多く，ピクセル数も多いため時間がかかってしまいます
1,0の境界の位置を探してそのピクセル数を得るのに時間短縮できる方法があれば，教えていただけると有難いです
最終的には写真から輪郭形状のグラフを作りたいと思っています

Accepted Answer

0と1の境界線が欲しいなら、変化点を探して距離を測ればいいんじゃないかなぁ。変化点なんで、まず微分します。
```python
a = np.array([1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 0, 0, 0])
offset = 1
diff_a = a[offset:] - a[:-offset]
```

1->0は-1の変化、0->1は+1の変化なので、それぞれの場所をnp.argwhereを使って抽出します。
```
pos1to0 = np.where(diff_a ==-1)[0] + offset # -> [8, 10]
pos0to1 = np.where(diff_a ==+1)[0] + offset # -> [9]
```
右端が必ず0で終わると仮定すれば、pos0to1を微調整してインデックスの差分を取れば1が連続する長さを測れます。
```
pos0to1 = np.append([0], pos0to1)
len11 = pos1to0 - pos0to1 
```

pythonのfor-loopが遅いので行列のインデックスを駆使した方法です。理解してコーディングしないと収拾がつかなくなるので、適度な用法用量を守ってご参考にしてください。

----
追記

mkgreyさんのコードそのまま回したケース
[groupby] done in 0.39933 s
[forward-search] done in 0.12787 s
[backward-search] done in 0.05486 s

最大の長さを返すよう若干修正したバージョン
```

In [51]: slen = 1000         
    ...: tslen = 1200           
    ...: N = 1000      
    ...:                            
    ...: random.seed(0)                                  
    ...: s_org = [1]*(tslen-slen) + [random.randint(0, 1) for _ in range(1000)]
    ...:                                      
In [52]: with timer("numpy"):
    ...:     a = np.array(s_org)
    ...:     offset = 1
    ...:     diff_a = a[1:] - a[:-1]
    ...:     pos1to0 = np.where(diff_a ==-1)[0] + offset 
    ...:     pos0to1 = np.where(diff_a ==+1)[0] + offset
    ...:     pos0to1 = np.append([0], pos0to1)
    ...:     len11 = (pos1to0 - pos0to1).max()
    ...:         
[numpy] done in 0.00026 s
In [53]: assert len11 == 202
```

Answer

[RLE (Run Length Encoding)](https://ja.wikipedia.org/wiki/%E9%80%A3%E9%95%B7%E5%9C%A7%E7%B8%AE)を高速にできれば、境界をグラフ化するのも簡単になりそうですね。

Pure PythonでRLEを書くには`itertools.groupby`を使うのが正攻法らしいです。Pure Pythonに限らなければもっと速く書くことはできると思います。

```python
from itertools import groupby
[(k, len(list(g))) for k, g in groupby("111100010101011111000")]
"""
[('1', 4),
 ('0', 3),
 ('1', 1),
 ('0', 1),
 ('1', 1),
 ('0', 1),
 ('1', 1),
 ('0', 1),
 ('1', 5),
 ('0', 3)]
"""
```

長さ1（非連続）の1を取り除くのはRLE後でも可能ですが、手間がかかるのでできるだけRLE前に別途画像処理系のアルゴリズムで取り除いておくほうが良いと思います。良くは知りませんがノイズ除去処理あたりだと思います。

Answer

> 一列目はすべて１から始まっています

本来の目的から考えると、私なら左端を塗りつぶした画像を新たに作成します。
OpenCVを使えば内部はネイティブ処理してくれると思うので速度も期待できます。
以下例では左端の黒を白ですが、逆も同様の考えでできます。
```Python
import cv2
img = cv2.imread( 'bin.bmp', cv2.IMREAD_GRAYSCALE) # 簡単のため2値ビットマップを読込
print(img.shape)
# y方向に左端が黒を白に塗りつぶし
for r in range(img.shape[0]):
    if img[r,0] == 0:
        print('fill',r)
        cv2.floodFill(img,None,(0,r),255)
cv2.imwrite('out.jpg',img)
```
bin.bmp
![イメージ説明](f80fab693cabbe32b00180da7fa44bb9.jpeg)
out.jpg
![イメージ説明](9dc7297b05bd0190a2e932065bea959b.jpeg)

Answer

シンプルに書けば速くなる‥なんて甘くはないだろうけど。

```python
import numpy as np

pixels = np.array([[1,1,1,0,0,0],[1,0,0,0,0,0],[1,1,1,1,1,0],[1,1,1,1,1,1]])

def search0(line):
    try:
        return line.index(0)
    except:
        return 0

print([search0(list(line)) for line in pixels])
# [3, 1, 5, 0]
```

絶対に0が含まれているなら、

```python
pixels = np.array([[1,1,1,0,0,0],[1,0,0,0,0,0],[1,1,1,1,1,0]])
print([list(line).index(0) for line in pixels])
# [3, 1, 50]
```

Answer

もしかしてnumpy配列を直接pythonから処理していますか？
それなら、cythonの力で高速化しちゃえば同じアルゴリズムで100倍くらいは期待できるはずです。

参考ページ：
[NumPyとCythonを組み合わせると爆速！ - Kesinの知見置き場 ](http://kesin.hatenablog.com/entry/20120314/1331689014)

Answer

元の配列からひとつずらした配列を作成して、ベクトル同士の引き算をします。結果のベクトルの要素がゼロならひとつ前の値と連続状態にあることになります。
処理はnumpyのarrayにすれば簡単かと思います。2次元ベクトルと見なしてしまえばこの差の計算は1回で終わります。
arrayのsliceを使ったほうが簡単かもしれません

Answer

https://www.geeksforgeeks.org/maximum-consecutive-ones-or-zeros-in-a-binary-array/

普通に考えて全部のピクセルを見ないといけないのでO(N)になります。(worstケース)

最も簡単な方法は並列化です。
今回の場合、単純並列なので、立てることのできるスレッドの数分の1に計算時間を減らすことができます。

あとはアルゴリズムの話になりますが、例えばk番目まで見て、今のマスは0でこれまでの最長の1たちは100個でした。

そうすれば、とりあえず次は、k+100を見てみることにします。
こいつが1であればk+50を見てみることにします。
そして…

なんとなくお察しいただけるかと思いますが、このように探索することで枝切りの可能性が増えます。
例えばk+50の時点で0に出逢えば、k+1~~k+49、k+51~~k+99はもう探索する必要はありません。

このようにすることで常に153620481000個のピクセルを見なければいけなかったところを、より少ないピクセルを探索すれば良いことになります。

後はデータの性質に依存します。
01010101010101010101010101010のように並んでいるのであれば判定が必要な分遅くなります。
11111111110000011100000000011のようであれば、大幅に探索を減らすことができます。

ブロック分けしてdivide-and-conquerでもよいですが。

↓    ↓↓　　↓
0000001 0111011 ...
0000010 1111011 ...
1000010 0000000 ...
1100001 1000001 ...
1000010 0111110 ...
...

比較。（更新：groupby, numpy.where, backward, forward）

python
1from itertools import groupby
2import numpy as np
3import random
4
5from contextlib import contextmanager
6import time
7@contextmanager
8def timer(name):
9    t0 = time.time()
10    yield
11    print(f'[{name}] done in {time.time() - t0:.5f} s')
12
13slen = 1300
14tslen = 1500
15N = 10000
16
17ss = []
18for _i in range(N):
19    random.seed(_i)
20    s_ = np.array([1]*(tslen-slen) + [random.randint(0, 1) for _ in range(slen)])
21    ss.append(s_)
22
23with timer('groupby'):
24    mm0 = []
25    for _i in range(N):
26        s = ss[_i]
27        ans = [len(list(g)) for k, g in groupby(s)]
28        m = max(ans[::2])
29        mm0.append(m)
30        
31with timer('numpy.where'):
32    mm1 = []
33    for _i in range(N):
34        a = ss[_i]
35        offset = 1
36        diff_a = a[offset:] - a[:-offset]
37
38        pos1to0 = np.where(diff_a ==-1)[0] + offset
39        pos0to1 = np.where(diff_a ==+1)[0] + offset
40
41        pos0to1 = np.append([0], pos0to1)
42        m = (pos1to0 - pos0to1[:len(pos1to0)]).max()
43        mm1.append(m)
44
45with timer('backward-search'):
46    def forward_search(s):
47        j = 0
48        while j < len(s) and s[j] == 1:
49            j += 1
50        return j
51    
52    def backward_search(s, m):
53        if m >= len(s):
54            return False, len(s), 0
55        t = s[m::-1]
56        c = forward_search(t)
57        return True, m, c
58
59    mm2 = []
60    for _i in range(N):
61        s = ss[_i]
62        m = 0
63        i = forward_search(s)
64        m = i
65        while i < len(s):
66            fforward, j, c = backward_search(s[i:], m)
67            i += j
68            if fforward:
69                j = forward_search(s[i:])
70                c += j
71                i += j
72                if c > m:
73                    m = c
74        mm2.append(m)
75        
76with timer('forward-search'):
77    mm3 = []
78    for _i in range(N):
79        s = ss[_i]
80        m = 0
81        c = 0
82        for v in s:
83            if v == 1:
84                c += 1
85            else:
86                if c > m:
87                    m = c
88                c = 0
89        if c > m:
90            m = c
91        mm3.append(m)
92
93assert np.all(mm0 == mm1)
94assert np.all(mm0 == mm2)
95assert np.all(mm0 == mm3)

雑談

高速化を行う際には、

アルゴリズムの改良
コーディングの改良

に分けて考えるとスッキリします。

今回の場合、最低でもO(N)で各ピクセルを見ないと答えが出ないような問題です。
すると、探索の打ち切りの可能性を検討した後、コーディングの改良を検討します。

（目的とあっていない可能性がありますが、
最長の1の塊を探索するのであれば、最長になりえない領域をできるだけスキップする作戦を考えます。）

次に書き方を工夫します。
（ブロック化してSIMD命令を利用するのが、C++などのコンパイル言語を使う際に検討する必要があります。）
Pythonの場合、numpy、opencvのライブラリを出来る限り利用できるようにするのが近道です。
すると、numpyのメソッド、opencvのメソッド、pythonのbuilt-inメソッドを使用することを検討すべきです。

一個ずつピクセルを見ていくより、ベクトルとみなしてsumが速いことは予想できます。
ならば、sumだけで済むように前処理を検討するのが良さそうです。

opencvのオープニングを使うことで先にノイズを消してから、sumを行うのが一番速そうです。

他にもバイナリとして扱ってビット演算を用いることで高速化することも考えられます。
Pythonでそれをやるのは少しちぐはぐ感が残ってしまいます。
C++などで書き換えるだけで、もとのアルゴリズムで高速に処理できることが見込まれるためです。

（重複するようなケースが出現する場合、キャッシュをうまく使うことも重要です。
https://pypi.python.org/pypi/fastcache/0.4.3
メモリと演算のバランスをチューニングするがよいコード書くために大切です。）

高速化することも大事ですが、楽して高速化することも大事です。

Answer

初めて1が来たところから0が来るまでfor文やwhile文でカウントし、カウントした数を別のリストに格納する。if文で評価し、0だったらbreak文で切る

これでどうでしょうか?