回答編集履歴

2018/10/30 09:36

投稿

スコア21956

test CHANGED Viewed

@@ -132,9 +132,9 @@
 姓名がどちらかわからないということであれば、次に2パターンを試せば、全パターン試したことになります。
-列1 vs 列3 and 列2, 列4
+列1 vs 列3 and 列2 vs 列4
-列1 vs 列4 and 列2, 列3
+列1 vs 列4 and 列2 vs 列3

2018/10/30 09:36

投稿

tiitoi

スコア21956

test CHANGED Viewed

@@ -132,9 +132,9 @@
 姓名がどちらかわからないということであれば、次に2パターンを試せば、全パターン試したことになります。
-列1 vs 列2 and 列3, 列4
+列1 vs 列3 and 列2, 列4
-列1 vs 列3 and 列2, 列4
+列1 vs 列4 and 列2, 列3

あ

2018/10/30 09:36

投稿

tiitoi

スコア21956

test CHANGED Viewed

@@ -26,13 +26,13 @@
 for r in range(1, sheet.max_row + 1):
-    data1.append({'first': sheet.cell(row=r, column=1).value,
+    data1.append({'name1': sheet.cell(row=r, column=1).value,
-                  'last': sheet.cell(row=r, column=2).value})
+                  'name2': sheet.cell(row=r, column=2).value})
-    data2.append({'first': sheet.cell(row=r, column=4).value,
+    data2.append({'name1': sheet.cell(row=r, column=4).value,
-                  'last': sheet.cell(row=r, column=3).value})
+                  'name2': sheet.cell(row=r, column=3).value})
 print(data1)
@@ -48,21 +48,29 @@
     for j, person2 in enumerate(data2):
-        # 名前の一致度
+        match1 = Levenshtein.jaro(person1['name1'], person2['name1'])
-        first_name_match = Levenshtein.jaro(person1['first'], person2['first'])
+        match2 = Levenshtein.jaro(person1['name2'], person2['name2'])
-        # 姓の一致度
-        last_name_match = Levenshtein.jaro(person1['last'], person2['last'])
-        # 姓及び名の一致度が 0.9 以上の場合、一致したと判断する。
-        if first_name_match > 0.9 and last_name_match > 0.9:
+        if match1 > 0.9 and match2 > 0.9:
             matches.append([i, j])
+            break
+        match1 = Levenshtein.jaro(person1['name1'], person2['name2'])
+        match2 = Levenshtein.jaro(person1['name2'], person2['name1'])
-            break  # 同じ人物が同一データベースに重複していないという仮定
+        if match1 > 0.9 and match2 > 0.9:
+            matches.append([i, j])
+            break
 print(matches)
@@ -72,23 +80,23 @@
 out_sheet = wb.create_sheet('matches')
-for row, [i, j] in enumerate(matches):
+for row, [i, j] in enumerate(matches, 1):
     # データベース1の一致した行の情報
-    out_sheet.cell(row=i, column=1).value = i + 1
+    out_sheet.cell(row=row, column=1).value = i + 1
-    out_sheet.cell(row=i, column=2).value = data1[i]['first']
+    out_sheet.cell(row=row, column=2).value = data1[i]['name1']
-    out_sheet.cell(row=i, column=3).value = data1[i]['last']
+    out_sheet.cell(row=row, column=3).value = data1[i]['name2']
     # データベース2の一致した行の情報
-    out_sheet.cell(row=i, column=4).value = j + 1
+    out_sheet.cell(row=row, column=4).value = j + 1
-    out_sheet.cell(row=i, column=5).value = data2[j]['first']
+    out_sheet.cell(row=row, column=5).value = data2[j]['name1']
-    out_sheet.cell(row=i, column=6).value = data2[j]['last']
+    out_sheet.cell(row=row, column=6).value = data2[j]['name2']
@@ -104,10 +112,34 @@
 ```
+1	TANAKA	SHOICHI	3	SHOUICHI	TANAKA
 2	YAMADA	TARO	1	YAMADA	TARO
 ```
 データ1の2行目「YAMADA TARO」とデータ2の1行目「YAMADA TARO」が一致したことを表している。
+## 追記
+姓名がどちらかわからないということであれば、次に2パターンを試せば、全パターン試したことになります。
+列1 vs 列2 and 列3, 列4
+列1 vs 列3 and 列2, 列4
+![イメージ説明](aa3fcaa30c596554d7c74e7eb7089979.png)
+丸の中の数字は列数