回答編集履歴
2
日本語の文法
answer
CHANGED
@@ -74,4 +74,39 @@
|
|
74
74
|
- 平仮名 (ひらがな)
|
75
75
|
- 片仮名 (カタカナ)
|
76
76
|
|
77
|
+
### 日本語の文法
|
78
|
+
|
79
|
+
正規表現とは、特定の文法に則った文字列から特定の文字列を検索するものです。
|
80
|
+
|
81
|
+
「URL文字列」を抽出するなら、URLの文法規則を知っていなければなりません。
|
82
|
+
「HTMLタグ」を抽出するなら、HTMLの文法規則を知っていなければなりません。
|
83
|
+
「人名」を抽出するなら、「人名」の文法規則を知っていなければなりません。
|
84
|
+
|
85
|
+
では、人名の文法とは何なのか。
|
86
|
+
[ぐぐれば](https://www.google.co.jp/search?q=%E6%97%A5%E6%9C%AC+%E4%BA%BA%E5%90%8D+%E8%A6%8F%E5%89%87)、戸籍法に則っていることが分かります(前節参照)。
|
87
|
+
日本の人名に使える文字は「漢字」「ひらがな」「カタカナ」の三種ですが、他に規則性を表すものはありません。
|
88
|
+
姓名が必要な都合上、フルネームで2文字以上という制約はありますが、それだけです。
|
89
|
+
|
90
|
+
日本語は英語と違い、単語の区切りを識別しづらい言語です。例えば、次の日本語を考えてみましょう。
|
91
|
+
|
92
|
+
```
|
93
|
+
「JavaScript愛を感じます」(JavaScriptへの深い愛情を感じます)
|
94
|
+
「加藤愛を感じます」(加藤さんへの深い愛情を感じます or 加藤愛さんを感じます)
|
95
|
+
```
|
96
|
+
|
97
|
+
後者は2つの解釈が成り立ちますが、この文章だけでは判断することは出来ません。
|
98
|
+
前後の文脈から想像するわけですが、それでも100%正しいとはいえません。
|
99
|
+
|
100
|
+
また、「漢字だけで構成される人名」に限り、漢字の連続を名前と見なす事は可能ですが、
|
101
|
+
|
102
|
+
```
|
103
|
+
「加藤様」(加藤 + 様)
|
104
|
+
「佐藤殿」(佐藤 + 殿)
|
105
|
+
```
|
106
|
+
|
107
|
+
このように「敬称」が付くと、「名前」と「敬称」を区別することが出来ません。
|
108
|
+
「様」「殿」は常用漢字表に載っており、名前に使用される可能性がありますので、末尾にそれがあるからといって、除外することは出来ません。
|
109
|
+
敬称に限らず、名前の前後に関する漢字が来るケースは他にもあるでしょう。
|
110
|
+
それに対して完璧に名前以外と判断する術を私は持ちません。
|
111
|
+
|
77
112
|
Re: SugiuraY さん
|
1
日本の戸籍法における、人名に使用可能な文字
answer
CHANGED
@@ -59,4 +59,19 @@
|
|
59
59
|
では、「任意の一文字」の表記揺れ対策としては、誤爆を防ぐ方法はありません。
|
60
60
|
新旧漢字体のリストを作って対応すべきでしょう。
|
61
61
|
|
62
|
+
### 日本の戸籍法における、人名に使用可能な文字
|
63
|
+
|
64
|
+
- [戸籍法施行規則](http://elaws.e-gov.go.jp/search/elawsSearch/elaws_search/lsg0500/detail?lawId=322M40000010094#302)
|
65
|
+
|
66
|
+
> **第六十条** 戸籍法第五十条第二項の常用平易な文字は、次に掲げるものとする。
|
67
|
+
> 一 常用漢字表(平成二十二年内閣告示第二号)に掲げる漢字(括弧書きが添えられているものについては、括弧の外のものに限る。)
|
68
|
+
> 二 別表第二に掲げる漢字
|
69
|
+
> 三 片仮名又は平仮名(変体仮名を除く。)
|
70
|
+
|
71
|
+
まとめると、次のように。
|
72
|
+
|
73
|
+
- 漢字 ([常用漢字表](http://www.bunka.go.jp/kokugo_nihongo/sisaku/joho/joho/kijun/naikaku/pdf/joyokanjihyo_20101130.pdf), [別表第二](http://elaws.e-gov.go.jp/search/html/322M40000010094_20170925_429M60000010032/pict/S22F00501000094-001.pdf) に記載されている文字に限る)
|
74
|
+
- 平仮名 (ひらがな)
|
75
|
+
- 片仮名 (カタカナ)
|
76
|
+
|
62
77
|
Re: SugiuraY さん
|