質問編集履歴

6

修正

2018/06/30 13:17

投稿

SugiuraY
SugiuraY

スコア318

test CHANGED
File without changes
test CHANGED
@@ -22,7 +22,7 @@
22
22
 
23
23
  ```
24
24
 
25
- /.橋太郎|高.太郎|高橋.郎|高橋太./
25
+ pattern ="/.橋太郎|高.太郎|高橋.郎|高橋太./"
26
26
 
27
27
  ```
28
28
 

5

修正いたしました。

2018/06/30 13:17

投稿

SugiuraY
SugiuraY

スコア318

test CHANGED
File without changes
test CHANGED
@@ -40,4 +40,38 @@
40
40
 
41
41
 
42
42
 
43
+ 名前かであるのか、名前でないのかという点については、なんらの判断基準を設けることはできません。
44
+
45
+ 前後の文脈があるのかまたはないのかも不明で、前後に特定の文字や空白等があるという規則もありません。
46
+
47
+ 敷いて申し上げれば、例でいえば、
48
+
49
+ /.橋太郎|高.太郎|高橋.郎|高橋太./
50
+
51
+ のいずれかに当てはまる特定の文字数の外側にあるものは名前以外であると言うだけです。
52
+
53
+ したがって、
54
+
55
+ 37歳の高橋太は衆議院議員です。
56
+
57
+ と言う文字列は"高橋太は"が/高橋太./に一致してしまいます。
58
+
59
+ 質問の趣旨としては
60
+
61
+ 1)これに対応するような正規表現の考え方はありますか?
62
+
63
+ 2)それがない場合には、そもそも不特定の文脈の中にある特定数の文字列でその中の1文字だけが異なるような方法で良い方法が一般的にあるのでしょうか?
64
+
65
+
66
+
67
+ と言うことを申し上げたく、上記の2例をあげさせていただきました。
68
+
69
+ 実務的に文脈の中で名前を正規表現で検索する際に、旧漢字等を簡体字で使用されているケースもあるので
70
+
71
+ 1文字だけが間違っている部分一致検索をする場合どのような方法をとっていらっしゃるのかと言うアドバイスをいただきたいと言う趣旨でした。
72
+
73
+
74
+
75
+
76
+
43
77
  宜しくお願い申し上げます

4

2018/06/30 13:13

投稿

SugiuraY
SugiuraY

スコア318

test CHANGED
File without changes
test CHANGED
File without changes

3

2018/06/30 12:12

投稿

SugiuraY
SugiuraY

スコア318

test CHANGED
File without changes
test CHANGED
@@ -1,45 +1,43 @@
1
1
  以下のような文字列がございます。
2
2
 
3
- 佐藤太郎について
4
3
 
5
- 加藤太郎/佐坂太郎/佐藤次郎/佐藤太一とは一致させたく
6
4
 
7
- 佐藤/藤太郎とは一致させたくない正規表現を検討しており
5
+ "立候補者の高橋太郎です!"
8
6
 
9
- ```ここ言語を入力
7
+ "明日は一緒行く方は、渡辺花子"
10
8
 
9
+
10
+
11
+ これに対して、
12
+
11
- pattern =".藤太郎|佐.太郎|佐藤.郎|.藤太郎"
13
+ 髙橋太郎// 旧漢字の髙
14
+
15
+ 渡邉花子//旧漢字の邉
16
+
17
+ は一致するような正規表現を検討しております。
18
+
19
+
20
+
21
+ これに対して
12
22
 
13
23
  ```
14
24
 
25
+ /.橋太郎|高.太郎|高橋.郎|高橋太./
26
+
27
+ ```
28
+
15
- では藤太郎や藤太郎に一致してしまいます。これは一致させくないです。
29
+ では名前の前後の1文字は名前でなくも認識されてしまうため、
30
+
31
+ 立候補者の橋太郎です!
32
+
33
+ も一致してしまいます。
16
34
 
17
35
 
18
36
 
19
- .の箇所ある必ず任意の一文字で
20
37
 
38
+
21
- 上記の.や特定の文字列以外の前の文字全て許容します。
39
+ 名前の文字数も含めてそ前の中で1文字だけ異なっても一致するようにさせる正規表現考えられますでしょうか
22
40
 
23
41
 
24
42
 
25
- つまり、佐藤太郎であれば
26
-
27
- 立候補者佐藤太郎です!は一致
28
-
29
- 立候補者佐藤二郎です!も一致
30
-
31
- 立候補者谷佐藤二郎です!も一致
32
-
33
- 立候補者佐藤一です!は不一致
34
-
35
-
36
-
37
- 立候補者 です!にはパターンがありません。
38
-
39
- どのようにしたら文字数も一致条件に入れることが出来ますでしょうか。
40
-
41
-
42
-
43
- 正規表現に不案内で申し訳ございませんが
44
-
45
- 宜しくお願い申し上げます
43
+ 宜しくお願い申し上げます

2

2018/06/30 12:10

投稿

SugiuraY
SugiuraY

スコア318

test CHANGED
File without changes
test CHANGED
@@ -34,6 +34,8 @@
34
34
 
35
35
 
36
36
 
37
+ 立候補者 です!にはパターンがありません。
38
+
37
39
  どのようにしたら文字数も一致条件に入れることが出来ますでしょうか。
38
40
 
39
41
 

1

2018/06/30 10:32

投稿

SugiuraY
SugiuraY

スコア318

test CHANGED
File without changes
test CHANGED
@@ -12,7 +12,27 @@
12
12
 
13
13
  ```
14
14
 
15
- では藤太郎一致してしまうのですが、
15
+ では藤太郎や藤太郎に一致してしまいます。これは一致させくないです
16
+
17
+
18
+
19
+ .の箇所ある必ず任意の一文字で
20
+
21
+ 上記のの.や特定の文字列以外の前後の文字列は全て許容します。
22
+
23
+
24
+
25
+ つまり、佐藤太郎であれば
26
+
27
+ 立候補者佐藤太郎です!は一致
28
+
29
+ 立候補者佐藤二郎です!も一致
30
+
31
+ 立候補者谷佐藤二郎です!も一致
32
+
33
+ 立候補者佐藤一です!は不一致
34
+
35
+
16
36
 
17
37
  どのようにしたら文字数も一致条件に入れることが出来ますでしょうか。
18
38