編集履歴

回答編集履歴

挿入ソート版追記

2019/02/14 02:29

投稿

スコア38350

answer CHANGED Viewed

@@ -144,4 +144,83 @@
  [ 3.  6. nan nan nan]
  [ 4.  7. nan nan nan]]
 """
+```
+挿入ソート版
+-----
+題意から以下の処理でもよさそうです。
+再帰版よりもはるかに速く処理できます。
+```Python
+import numpy as np
+import pprint
+import pandas as pd
+from io import StringIO
+f = StringIO("""c1,c2,c3,c4,c5
+,,7,8,
+1,2,,,
+,,6,6,
+4,7,,,
+,,,2,1
+,,,7,4
+6,9,,,
+,1,2,,
+,,,9,5
+,4,4,,
+,,1,1,
+2,3,,,
+5,8,,,
+,,,3,2
+,,3,4,
+,5,5,,
+,,,5,3
+3,6,,,""")
+ary = pd.read_csv(f).values.tolist()
+ret = []
+# 各列について左から順に処理
+col_cnt = len(ary[0])
+for c in range(col_cnt):
+    # 対象列がnanでない行のみ抜き出す
+    rows = []
+    for r in ary[::-1]:
+        if not np.isnan(r[c]):
+            rows.append(r)
+            ary.remove(r)
+    # 結果配列に列値が昇順になるように挿入していく
+    for row in rows:
+        is_ins = False
+        for idx,ret_row in enumerate(ret):
+            if row[c] < ret_row[c]:
+                ret.insert(idx,row)
+                is_ins = True
+                break
+        if not is_ins:
+            ret.append(row)
+pprint.pprint(ret)
+"""
+[[nan, nan, 1.0, 1.0, nan],
+ [nan, 1.0, 2.0, nan, nan],
+ [1.0, 2.0, nan, nan, nan],
+ [2.0, 3.0, nan, nan, nan],
+ [nan, nan, nan, 2.0, 1.0],
+ [nan, nan, nan, 3.0, 2.0],
+ [nan, nan, 3.0, 4.0, nan],
+ [nan, 4.0, 4.0, nan, nan],
+ [nan, 5.0, 5.0, nan, nan],
+ [3.0, 6.0, nan, nan, nan],
+ [4.0, 7.0, nan, nan, nan],
+ [5.0, 8.0, nan, nan, nan],
+ [6.0, 9.0, nan, nan, nan],
+ [nan, nan, nan, 5.0, 3.0],
+ [nan, nan, 6.0, 6.0, nan],
+ [nan, nan, nan, 7.0, 4.0],
+ [nan, nan, 7.0, 8.0, nan],
+ [nan, nan, nan, 9.0, 5.0]]
+"""
 ```

再帰版を追記

2019/02/14 02:29

投稿

8524ba23

スコア38350

answer CHANGED Viewed

@@ -57,4 +57,91 @@
  [nan  4.  4. nan nan]
  [nan nan nan  3.  2.]]
 """
+```
+再帰版
+-----
+総当たりよりは速いですが、15行程度が限界ですね。
+```Python
+import numpy as np
+def search( ary):
+    row_cnt = ary.shape[0]
+    col_cnt = ary.shape[1]
+    # 条件を満たすか
+    # row  : 行の位置
+    # mins : 現時点の各列の最小値
+    def is_match(row,mins):
+        for col in range(col_cnt):
+            v = ary[row,col]
+            if np.isnan(v):
+                continue
+            if v < mins[col]:
+                return False
+            mins[col] = v # 最小値を更新
+        return True
+    # rows : 行位置の配列
+    # mins : 現時点の各列の最小値
+    def search_row(rows,mins):
+        if len(rows) == row_cnt:
+            return rows
+        rows_set = set(rows)
+        for row in range(row_cnt):
+            if row in rows_set: # 重複は除く
+                continue
+            next_mins = mins.copy()
+            if is_match(row,next_mins):
+                ret = search_row(rows+[row],next_mins)
+                if ret:
+                    return ret
+    rows = search_row([],np.zeros(col_cnt))
+    return ary[rows,:]
+import pandas as pd
+from io import StringIO
+f = StringIO("""c1,c2,c3,c4,c5
+,,7,8,
+1,2,,,
+,,6,6,
+4,7,,,
+,,,2,1
+,,,7,4
+,1,2,,
+,4,4,,
+,,1,1,
+2,3,,,
+,,,3,2
+,,3,4,
+,5,5,,
+,,,5,3
+3,6,,,""")
+ary = pd.read_csv(f).values
+ret = search(ary)
+print(ret)
+"""
+[[nan nan  1.  1. nan]
+ [nan nan nan  2.  1.]
+ [nan  1.  2. nan nan]
+ [ 1.  2. nan nan nan]
+ [ 2.  3. nan nan nan]
+ [nan nan nan  3.  2.]
+ [nan nan  3.  4. nan]
+ [nan  4.  4. nan nan]
+ [nan  5.  5. nan nan]
+ [nan nan nan  5.  3.]
+ [nan nan  6.  6. nan]
+ [nan nan nan  7.  4.]
+ [nan nan  7.  8. nan]
+ [ 3.  6. nan nan nan]
+ [ 4.  7. nan nan nan]]
+"""
 ```