回答編集履歴

コード修正

2019/04/30 03:42

投稿

スコア38352

answer CHANGED Viewed

@@ -3,31 +3,40 @@
 import pandas as pd
 import numpy as np
-df1 = pd.DataFrame({'name': ['A','B','C','D','E'],'a':[1,5,5,8,9]})
+df1 = pd.DataFrame({'name': ['A','B','C','D','D-2','E'],'a':[1,5,5,5,8,9]})
 df2 = pd.DataFrame({'table': ['2','3-1','3-2','7'],'a':[2,3,3,7]})
 # df2の列値をタプル('table','a')のリストに展開
-df2_list = [(r[0],r[1]) for r in df2.values]
+lst2 = [(r[0],r[1]) for r in df2.values]
-# df2から指定値に最も近い'table'値を返す
+# df2から指定値に最も近いlst2の要素位置リストを返す
 def nearest(a):
-    if not df2_list:
-        return np.nan
-    m = min(df2_list, key=lambda v:(v[1]-a)*(v[1]-a))
+    m = min(lst2, key=lambda v:(v[1]-a)*(v[1]-a))
-    del df2_list[df2_list.index(m)] # df1に紐づけ済みは削除
+    return [i for i,v in enumerate(lst2) if v[1] == m[1]]
-    return m[0]
+used = set() # df1に割当済のlst2の要素位置
-# 割り当て
+# 最近傍値に割り当て
 for i,r in df1.iterrows():
+    val = np.nan
-    df1.loc[i,'table'] = nearest(r['a'])
+    idxs = nearest(r['a'])
+    while idxs:
+        idx = idxs.pop(0)
+        if idx not in used: # 未割当
+            val = lst2[idx][0]
+            used.add(idx) # 割当済を保持
+            break
+    df1.loc[i,'table'] = val
 print(df1)
 """
   name  a table
 0    A  1     2
 1    B  5   3-1
 2    C  5   3-2
-3    D  8     7
+3    D  5   NaN
+4  D-2  8     7
-4    E  9   NaN
+5    E  9   NaN
 """
 ```