Python 二次元配列から、任意のデータを探す

Question

np.arrayの二次元配列(要素数は5)から要素①,要素②,要素③,要素④の組み合わせが例えば、1,2,3,4の列の要素⑤を取得する場合はどうすればいいですか？

下記のようにすれば要素⑤の取得は可能ですが、何万回と繰り返す部分なのでもっと速く取得できる方法を教えてください。

```Python
for i in array:
    if i[0] == 1 and i[1] == 2 and i[2] == 3 and i[3] == 4:
        print(i[4])
```

Accepted Answer

こういうのはどうでしょうか。

```python
import timeit
import numpy as np

A = np.arange(50000).reshape((10000, 5))

def f0(a,b,c,d):
    """質問文の方式
    """
    lst = []
    for i in A:
        if i[0] == 1 and i[1] == 2 and i[2] == 3 and i[3] == 4:
            lst.append(i[4])
    # print(lst)
    lst

def f1(a,b,c,d):
    """私が考えた方式。一列ずつ見て、削っていきます
    こうすると比較の回数がケチれて（本質的には短絡評価と同じことをしています）速いはずです
    """
    tmp = A
    for i, eqv in enumerate([a,b,c,d]):
        tmp = tmp[tmp[:,i] == eqv]
    
    # print(tmp[:,-1])
    tmp[:,-1]  # 計測時にprintしたくなかったので

def f2(a,b,c,d):
    """mkgreiさんの方式
    """
    idx = (A[:, :4]==np.array([a,b,c,d])).all(axis=-1)
    # print(A[idx, -1])
    A[idx, -1]  # 計測時にprintしたくなかったので

print(timeit.timeit(lambda : f0(0,1,2,3), number=1000))
print(timeit.timeit(lambda : f1(0,1,2,3), number=1000))
print(timeit.timeit(lambda : f2(0,1,2,3), number=1000))
"""
私の環境だと、
3.3318773460000557
0.06133379499988223
0.27946032499994544
くらい
"""
```

Answer

何も考えないで自然に書いたら他の人より100倍以上遅いんですけどなんなんですかね
```python3
def f3(a, b, c, d):
    result = []
    c = np.array([1, 2, 3, 4])
    for r in A:
        if np.array_equal(r[0:4], c):
            result.append(r[4])

```
指摘お待ちしてまーす


今見たらキモかったから書き直した
```python3
import timeit
import numpy as np

A = np.random.randint(low=1, high=5, size=(10000, 5))


def fao_fun(A):
    result = []
    t = np.array([1, 2, 3, 4])
    for row in A:
        if np.array_equal(row[0:4], t):
            result.append(row[4])

print(timeit.timeit(lambda: fao_fun(A), number=1))
```
0.10979769402183592

やっぱり他の人の100倍位遅いね
なんでかな

Answer

最近覚えたmemoryviewで。

```python
import numpy as np
view = memoryview(np.array([95, 96, 97, 98]))
view_size = len(view)
A = np.arange(50000).reshape((10000, 5))

for row in A:
    if memoryview(row)[:view_size] == view:
        print(row[-1])
```

# 追記

```python
ans = tuple(v[-1] for v in map(memoryview, A) if v[:view_size] == view)
print(ans)
```

# 追記２：恥ずかしいくらい遅いので本気を出す

慣れないnumpyを使わずに2dのtuple->listにして素直に書いた方が結果自己記録的に速かった。

```python
import numpy as np

t = [95, 96, 97, 98]
A = tuple(map(list, np.arange(50000).reshape((10000, 5))))
tuple(last for *first, last in A if first == t)
```

Answer

```python
import numpy as np 

a = np.random.randint(2, size=(50, 3))

idx = (a[:, :2]==np.array([0,1])).all(axis=-1)

print(a[idx, -1])
```

追記

追記２：恥ずかしいくらい遅いので本気を出す

関連した質問