回答編集履歴

追記

2020/03/27 02:35

投稿

kirara0048

スコア1399

answer CHANGED Viewed

@@ -26,7 +26,8 @@
 たとえば、
 ```python
-s = pd.Series([10, 10, 10, 12, 12, 12, 13, 13, 13, 1, 10, 12, 13, 1, 10, 11, 1, 13, 12])
+s = pd.Series([10, 10, 10, 12, 13, 13, 0, 0, 10, 12, 13, 10, 12, 10, 12, 13, 13])
+#             [10, 10, 10, 12, 13, 13,       10, 12, 13,       , 10, 12, 13, 13]
 v = np.array([10, 12, 13])
 function(s.to_numpy(), v)
@@ -35,12 +36,94 @@
 # 1    10   1
 # 2    10   1
 # 3    12   1
-# 4    12   1
+# 4    13   1
-# 5    12   1
+# 5    13   1
-# 6    13   1
+# 6    10   2
-# 7    13   1
+# 7    12   2
-# 8    13   1
+# 8    13   2
-# 9    10   2
+# 9    10   3
-# 10   12   2
+# 10   12   3
-# 11   13   2
+# 11   13   3
+# 12   13   3
+```
+## 挙動の解説
+### 1. 同じ値が連続する部分の除外
+「`10,12,13`はどれくらい連続しているか分からない」ということなので、同じ数が連続する部分をひとまとめにします。これは、インデックスを一つずらした配列と比較することで取得できます。
+```python
+cut_index, = np.r_[True, a[1:] != a[:-1], True].nonzero()
+short_a = a[cut_index[:-1]]
+"""
+a               : [10, 10, 10, 12, 13, 13,  0,  0, 10, 12, 13, 10, 12, 10, 12, 13, 13]
+a[1:]           :  10 [10, 10, 12, 13, 13,  0,  0, 10, 12, 13, 10, 12, 10, 12, 13, 13]
+a[:-1]          :     [10, 10, 10, 12, 13, 13,  0,  0, 10, 12, 13, 10, 12, 10, 12, 13] 13
+a[1:] != a[:-1] :     [ F,  F,  T,  T,  F,  T,  F,  T,  T,  T,  T,  T,  T,  T,  T,  F]
+(concatenate)   : [ T,  F,  F,  T,  T,  F,  T,  F,  T,  T,  T,  T,  T,  T,  T,  T,  F,  T]
+cut_index       : [ 0,          3,  4,      6,      8,  9, 10, 11, 12, 13, 14, 15,     17]
+short_a         : [10,         12, 13,      0,     10, 12, 13, 10, 12, 10, 12, 13,   ]
+"""
+```
+### 2. 一致箇所の検索
+前節で作成した配列`short_a`から、`10,12,13`のまとまりを探します。
+そのためにまず、`short_a`を3つずつ区切るためのインデックスを作成します。
+```python
+slide_index = np.arange(short_a.size-v_size+1)[:, None] + np.arange(v_size)
+print(slide_index)
+# [[ 0  1  2]
+#  [ 1  2  3]
+#  [ 2  3  4]
+#  ...
+#  [ 7  8  9]
+#  [ 8  9 10]
+#  [ 9 10 11]]
+```
+`v`と比較することで、`10,12,13`と一致する箇所を探します。
+```python
+match = (short_a[slide_index] == v).all(1)
+"""
+slide_a : [[10, 12, 13], [12, 13,  0], [13,  0, 10], [ 0, 10, 12], [10, 12, 13], ...]
+v       : [[10, 12, 13], [     >    ], [     >    ], [     >    ], [     >    ], ...]
+match   : [        True,        False,        False,        False,         True, ...]
+"""
+```
+`match`で得られた`True`は、`10,12,13`の`10`の位置のみなので、`np.convolve()`を利用して`10,12,13`の位置が`True`になるようにします。
+```python
+all_match = np.convolve(match, np.ones(v_size, dtype=int))
+"""
+short_a   : [10, 12, 13,  0, 10, 12, 13, 10, 12, 10, 12, 13]
+match     : [ T,  F,  F,  F,  T,  F,  F,  F,  F,  T]
+all_match : [ 1,  1,  1,  0,  1,  1,  1,  0,  0,  1,  1,  1]
+"""
+```
+### 3. 一致箇所の拡大復元
+前節で求めた`all_match`は、`10,10,10`のように同じ値が連続する部分がまとまった配列に対する位置なので、`np.repeat()`を用いて1.の逆を行います。
+```python
+index, = np.repeat(all_match, np.ediff1d(cut_index)).nonzero()
+"""
+a         : [10, 10, 10, 12, 13, 13,  0,  0, 10, 12, 13, 10, 12, 10, 12, 13, 13]
+cut_index : [ 0,          3,  4,      6,      8,  9, 10, 11, 12, 13, 14, 15,     17]
+all_match : [ 1,          1,  1,      0,      1,  1,  1,  0,  0,  1,  1,  1,   ]
+(repeat)  : [ 1,  1,  1,  1,  1,  1,  0,  0,  1,  1,  1,  0,  0,  1,  1,  1,  1]
+index     : [ 0,  1,  2,  3,  4,  5,          8,  9, 10,         13, 14, 15, 16]
+"""
 ```

微修正

2020/03/27 02:35

投稿

kirara0048

スコア1399

answer CHANGED Viewed

@@ -18,7 +18,7 @@
     result_array = a[index]
     result_index = np.isin(index, cut_index[match.nonzero()[0]]).cumsum()
-    return pd.DataFrame({'value': result_array, 'index': result_index})
+    return pd.DataFrame({'num': result_array, 'id': result_index})
 ```
 第一引数には対象のシリーズをnumpy配列に変換したものを、
@@ -30,17 +30,17 @@
 v = np.array([10, 12, 13])
 function(s.to_numpy(), v)
-#     value  index
+#     num  id
-# 0      10      1
+# 0    10   1
-# 1      10      1
+# 1    10   1
-# 2      10      1
+# 2    10   1
-# 3      12      1
+# 3    12   1
-# 4      12      1
+# 4    12   1
-# 5      12      1
+# 5    12   1
-# 6      13      1
+# 6    13   1
-# 7      13      1
+# 7    13   1
-# 8      13      1
+# 8    13   1
-# 9      10      2
+# 9    10   2
-# 10     12      2
+# 10   12   2
-# 11     13      2
+# 11   13   2
 ```

微修正

2020/03/19 05:08

投稿

kirara0048

スコア1399

answer CHANGED Viewed

@@ -10,10 +10,10 @@
     cut_index, = np.r_[True, a[1:] != a[:-1], True].nonzero()
     short_a = a[cut_index[:-1]]
-    slide_index = np.arange(short_a.size-v.size+1)[:, None] + np.arange(v.size)
+    slide_index = np.arange(short_a.size-v_size+1)[:, None] + np.arange(v_size)
     match = (short_a[slide_index] == v).all(1)
     all_match = np.convolve(match, np.ones(v_size, dtype=int))
-    index = np.repeat(all_match, np.ediff1d(cut_index)).nonzero()[0]
+    index, = np.repeat(all_match, np.ediff1d(cut_index)).nonzero()
     result_array = a[index]
     result_index = np.isin(index, cut_index[match.nonzero()[0]]).cumsum()