回答編集履歴
2
日本語の文法
test
CHANGED
@@ -150,4 +150,74 @@
|
|
150
150
|
|
151
151
|
|
152
152
|
|
153
|
+
### 日本語の文法
|
154
|
+
|
155
|
+
|
156
|
+
|
157
|
+
正規表現とは、特定の文法に則った文字列から特定の文字列を検索するものです。
|
158
|
+
|
159
|
+
|
160
|
+
|
161
|
+
「URL文字列」を抽出するなら、URLの文法規則を知っていなければなりません。
|
162
|
+
|
163
|
+
「HTMLタグ」を抽出するなら、HTMLの文法規則を知っていなければなりません。
|
164
|
+
|
165
|
+
「人名」を抽出するなら、「人名」の文法規則を知っていなければなりません。
|
166
|
+
|
167
|
+
|
168
|
+
|
169
|
+
では、人名の文法とは何なのか。
|
170
|
+
|
171
|
+
[ぐぐれば](https://www.google.co.jp/search?q=%E6%97%A5%E6%9C%AC+%E4%BA%BA%E5%90%8D+%E8%A6%8F%E5%89%87)、戸籍法に則っていることが分かります(前節参照)。
|
172
|
+
|
173
|
+
日本の人名に使える文字は「漢字」「ひらがな」「カタカナ」の三種ですが、他に規則性を表すものはありません。
|
174
|
+
|
175
|
+
姓名が必要な都合上、フルネームで2文字以上という制約はありますが、それだけです。
|
176
|
+
|
177
|
+
|
178
|
+
|
179
|
+
日本語は英語と違い、単語の区切りを識別しづらい言語です。例えば、次の日本語を考えてみましょう。
|
180
|
+
|
181
|
+
|
182
|
+
|
183
|
+
```
|
184
|
+
|
185
|
+
「JavaScript愛を感じます」(JavaScriptへの深い愛情を感じます)
|
186
|
+
|
187
|
+
「加藤愛を感じます」(加藤さんへの深い愛情を感じます or 加藤愛さんを感じます)
|
188
|
+
|
189
|
+
```
|
190
|
+
|
191
|
+
|
192
|
+
|
193
|
+
後者は2つの解釈が成り立ちますが、この文章だけでは判断することは出来ません。
|
194
|
+
|
195
|
+
前後の文脈から想像するわけですが、それでも100%正しいとはいえません。
|
196
|
+
|
197
|
+
|
198
|
+
|
199
|
+
また、「漢字だけで構成される人名」に限り、漢字の連続を名前と見なす事は可能ですが、
|
200
|
+
|
201
|
+
|
202
|
+
|
203
|
+
```
|
204
|
+
|
205
|
+
「加藤様」(加藤 + 様)
|
206
|
+
|
207
|
+
「佐藤殿」(佐藤 + 殿)
|
208
|
+
|
209
|
+
```
|
210
|
+
|
211
|
+
|
212
|
+
|
213
|
+
このように「敬称」が付くと、「名前」と「敬称」を区別することが出来ません。
|
214
|
+
|
215
|
+
「様」「殿」は常用漢字表に載っており、名前に使用される可能性がありますので、末尾にそれがあるからといって、除外することは出来ません。
|
216
|
+
|
217
|
+
敬称に限らず、名前の前後に関する漢字が来るケースは他にもあるでしょう。
|
218
|
+
|
219
|
+
それに対して完璧に名前以外と判断する術を私は持ちません。
|
220
|
+
|
221
|
+
|
222
|
+
|
153
223
|
Re: SugiuraY さん
|
1
日本の戸籍法における、人名に使用可能な文字
test
CHANGED
@@ -120,4 +120,34 @@
|
|
120
120
|
|
121
121
|
|
122
122
|
|
123
|
+
### 日本の戸籍法における、人名に使用可能な文字
|
124
|
+
|
125
|
+
|
126
|
+
|
127
|
+
- [戸籍法施行規則](http://elaws.e-gov.go.jp/search/elawsSearch/elaws_search/lsg0500/detail?lawId=322M40000010094#302)
|
128
|
+
|
129
|
+
|
130
|
+
|
131
|
+
> **第六十条** 戸籍法第五十条第二項の常用平易な文字は、次に掲げるものとする。
|
132
|
+
|
133
|
+
> 一 常用漢字表(平成二十二年内閣告示第二号)に掲げる漢字(括弧書きが添えられているものについては、括弧の外のものに限る。)
|
134
|
+
|
135
|
+
> 二 別表第二に掲げる漢字
|
136
|
+
|
137
|
+
> 三 片仮名又は平仮名(変体仮名を除く。)
|
138
|
+
|
139
|
+
|
140
|
+
|
141
|
+
まとめると、次のように。
|
142
|
+
|
143
|
+
|
144
|
+
|
145
|
+
- 漢字 ([常用漢字表](http://www.bunka.go.jp/kokugo_nihongo/sisaku/joho/joho/kijun/naikaku/pdf/joyokanjihyo_20101130.pdf), [別表第二](http://elaws.e-gov.go.jp/search/html/322M40000010094_20170925_429M60000010032/pict/S22F00501000094-001.pdf) に記載されている文字に限る)
|
146
|
+
|
147
|
+
- 平仮名 (ひらがな)
|
148
|
+
|
149
|
+
- 片仮名 (カタカナ)
|
150
|
+
|
151
|
+
|
152
|
+
|
123
153
|
Re: SugiuraY さん
|