正規表現を用いて、”サーバー”や”コンピューター”など、語尾に伸ばし棒がつく単語のみを取り出す場合、
[ァ-ヶー]+ー
[ァ-ヶー]+で「コンピュータ」や「サーバ」などの、伸ばし棒の前のカタカナ語に一致させます。
"ー"で語尾の伸ばし棒のみに一致させます。
↑
答えがこうなっているのですが、なぜ「ァ-ヶ」なのですか?
「ァ-ン」ではいけないのですか?
今までずっとカタカナの表記は「ア-ン」だと思ってきたのですが、
ここで「ア-ン」を用いているのはなぜでしょうか?
このように記載されていました。
もしかして「ァ-ォ」でもいいという考えですか?
ア-ンの場合はカタカナ全般という認識でしたので。。。
> 今までずっとカタカナの表記は「ア-ン」だと思ってきたのですが、
「思ってきた」ではなく、「確認」しましょう。
憶測で物事を決めるのはバグの元です。
文字コードによって順番は変わりますが、よほど古い処理系を想定するのでない限り、Unicode だと思って問題ないでしょう。
https://ja.wikipedia.org/wiki/%E7%89%87%E4%BB%AE%E5%90%8D_(Unicode%E3%81%AE%E3%83%96%E3%83%AD%E3%83%83%E3%82%AF)
上記のように、ダブルハイフンからコトまでがカタカナです。私はこれらすべて含めてカタカナとしていいと思いますが、[ァ-ヶー] を使ってもほとんどの場合は問題ないと思います。後は求められる仕様次第で増減するのが良いでしょう。
文字コード誤認も考えましたが、Shift_JIS,ISO-2022-JP.EUC-JP,UTF-8,UTF-16の全てで [ァ-ン] ではなかったこと。
[ァ-ン] がいつの間にか、[ア-ン] に摩り替わっている事から、文字コードまで考慮した考えではないと判断しました。
質問文に追記された「[ア-ン] のテキスト画像」は転載元がはっきりしませんが、誤りでしかないので、参考になりません。
お示しの画像に書かれている通り、[ア-ン]はアからンまでを指定できるが、ヴァなどが指定できません。
誤った例として書かれているのではないですか?
(しかし「アからンまで、つまりカタカナ」と言ってしまっているのは、これがカタカナの定義だと言っているのだろうか。そのような定義は少なくとも実用的でないと思う。)
> Zushinさん
> 上記のように、ダブルハイフンからコトまでがカタカナです。
違います。それはUnicodeのカタカナブロックであって、Unicodeのブロックは文字の種類の定義とは別物です。
またカタカナのオレオレ定義ですか。もうその終わった話は結構です。
どうしても自分で定義したいのなら、その定義に従って Wikipedia を編集してきてください。
名目上あなたへの返信の形をとっていますが、あなたがオレオレ定義をやめるとは思っていません。
誤った内容を信じてしまう人がいないよう注意書きとして書いています。
Wikipediaに特に編集する理由を感じません。
意味がわかってないのかな?
何の?
回答3件
あなたの回答
tips
プレビュー