質問するログイン新規登録

質問編集履歴

6

修正

2018/06/30 13:17

投稿

SugiuraY
SugiuraY

スコア318

title CHANGED
File without changes
body CHANGED
@@ -10,7 +10,7 @@
10
10
 
11
11
  これに対して
12
12
  ```
13
- /.橋太郎|高.太郎|高橋.郎|高橋太./
13
+ pattern ="/.橋太郎|高.太郎|高橋.郎|高橋太./"
14
14
  ```
15
15
  では名前の前後の1文字は名前でなくても認識されてしまうため、
16
16
  立候補者の橋太郎です!

5

修正いたしました。

2018/06/30 13:17

投稿

SugiuraY
SugiuraY

スコア318

title CHANGED
File without changes
body CHANGED
@@ -19,4 +19,21 @@
19
19
 
20
20
  名前の文字数も含めてその名前の中で1文字だけ異なっても一致するようにさせる正規表現は考えられますでしょうか。
21
21
 
22
+ 名前かであるのか、名前でないのかという点については、なんらの判断基準を設けることはできません。
23
+ 前後の文脈があるのかまたはないのかも不明で、前後に特定の文字や空白等があるという規則もありません。
24
+ 敷いて申し上げれば、例でいえば、
25
+ /.橋太郎|高.太郎|高橋.郎|高橋太./
26
+ のいずれかに当てはまる特定の文字数の外側にあるものは名前以外であると言うだけです。
27
+ したがって、
28
+ 37歳の高橋太は衆議院議員です。
29
+ と言う文字列は"高橋太は"が/高橋太./に一致してしまいます。
30
+ 質問の趣旨としては
31
+ 1)これに対応するような正規表現の考え方はありますか?
32
+ 2)それがない場合には、そもそも不特定の文脈の中にある特定数の文字列でその中の1文字だけが異なるような方法で良い方法が一般的にあるのでしょうか?
33
+
34
+ と言うことを申し上げたく、上記の2例をあげさせていただきました。
35
+ 実務的に文脈の中で名前を正規表現で検索する際に、旧漢字等を簡体字で使用されているケースもあるので
36
+ 1文字だけが間違っている部分一致検索をする場合どのような方法をとっていらっしゃるのかと言うアドバイスをいただきたいと言う趣旨でした。
37
+
38
+
22
39
  宜しくお願い申し上げます

4

2018/06/30 13:13

投稿

SugiuraY
SugiuraY

スコア318

title CHANGED
File without changes
body CHANGED
File without changes

3

2018/06/30 12:12

投稿

SugiuraY
SugiuraY

スコア318

title CHANGED
File without changes
body CHANGED
@@ -1,23 +1,22 @@
1
1
  以下のような文字列がございます。
2
+
3
+ "立候補者の高橋太郎です!"
4
+ "明日は一緒に行く方は、渡辺花子"
5
+
2
- 佐藤太郎つい
6
+ これ対し
3
- 加藤太郎/佐坂太郎/佐藤次郎/佐藤太一とは一致させたく
7
+ 髙橋太郎// 旧漢字の髙
8
+ 渡邉花子//旧漢字の邉
4
- 佐藤太一郎/藤太郎とは一致させたく正規表現を検討しており
9
+ は一致するような正規表現を検討しております。
10
+
5
- ```言語を入力
11
+ 対して
6
- pattern =".藤太郎|佐.太郎|佐藤.郎|.藤太郎"
7
12
  ```
13
+ /.橋太郎|高.太郎|高橋.郎|高橋太./
14
+ ```
8
- では藤太郎や藤太郎に一致してしまいます。これは一致させくないです。
15
+ では名前の前後の1文字は名前でなくも認識されてしまうため、
16
+ 立候補者の橋太郎です!
17
+ も一致してしまいます。
9
18
 
10
- .の箇所ある必ず任意の一文字で
11
- 上記のの.や特定の文字列以外の前後の文字列は全て許容します。
12
19
 
13
- つまり、佐藤太郎であれば
14
- 立候補者佐藤太郎です!は一致
15
- 立候補者佐藤二郎です!も一致
16
- 立候補者谷佐藤二郎す!も一致
20
+ 名前の文字数も含めてその名前の中1文字だけ異なっても一致するようにさせる正規表現は考えられますでしょうか。
17
- 立候補者佐藤一です!は不一致
18
21
 
19
- 立候補者 です!にはパターンがありません。
20
- どのようにしたら文字数も一致条件に入れることが出来ますでしょうか。
21
-
22
- 正規表現に不案内で申し訳ございませんが
23
- 宜しくお願い申し上げます
22
+ 宜しくお願い申し上げます

2

2018/06/30 12:10

投稿

SugiuraY
SugiuraY

スコア318

title CHANGED
File without changes
body CHANGED
@@ -16,6 +16,7 @@
16
16
  立候補者谷佐藤二郎です!も一致
17
17
  立候補者佐藤一です!は不一致
18
18
 
19
+ 立候補者 です!にはパターンがありません。
19
20
  どのようにしたら文字数も一致条件に入れることが出来ますでしょうか。
20
21
 
21
22
  正規表現に不案内で申し訳ございませんが

1

2018/06/30 10:32

投稿

SugiuraY
SugiuraY

スコア318

title CHANGED
File without changes
body CHANGED
@@ -5,7 +5,17 @@
5
5
  ```ここに言語を入力
6
6
  pattern =".藤太郎|佐.太郎|佐藤.郎|.藤太郎"
7
7
  ```
8
- では藤太郎一致してしまうのですが、
8
+ では藤太郎や藤太郎に一致してしまいます。これは一致させくないです
9
+
10
+ .の箇所ある必ず任意の一文字で
11
+ 上記のの.や特定の文字列以外の前後の文字列は全て許容します。
12
+
13
+ つまり、佐藤太郎であれば
14
+ 立候補者佐藤太郎です!は一致
15
+ 立候補者佐藤二郎です!も一致
16
+ 立候補者谷佐藤二郎です!も一致
17
+ 立候補者佐藤一です!は不一致
18
+
9
19
  どのようにしたら文字数も一致条件に入れることが出来ますでしょうか。
10
20
 
11
21
  正規表現に不案内で申し訳ございませんが