質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

Q&A

解決済

3回答

12096閲覧

なぜ「ァ-ヶ」なのか?「ァ-ン」ではいけないのか

y_tantan

総合スコア19

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

0グッド

2クリップ

投稿2019/12/20 12:35

編集2019/12/29 05:26

正規表現を用いて、”サーバー”や”コンピューター”など、語尾に伸ばし棒がつく単語のみを取り出す場合、

[ァ-ヶー]+ー
[ァ-ヶー]+で「コンピュータ」や「サーバ」などの、伸ばし棒の前のカタカナ語に一致させます。
"ー"で語尾の伸ばし棒のみに一致させます。


答えがこうなっているのですが、なぜ「ァ-ヶ」なのですか?
「ァ-ン」ではいけないのですか?

イメージ説明
今までずっとカタカナの表記は「ア-ン」だと思ってきたのですが、
ここで「ア-ン」を用いているのはなぜでしょうか?


イメージ説明

このように記載されていました。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Zuishin

2019/12/20 12:52

もしかして「ァ-ォ」でもいいという考えですか?
y_tantan

2019/12/20 13:17

ア-ンの場合はカタカナ全般という認識でしたので。。。
think49

2019/12/20 14:33 編集

> 今までずっとカタカナの表記は「ア-ン」だと思ってきたのですが、 「思ってきた」ではなく、「確認」しましょう。 憶測で物事を決めるのはバグの元です。
Zuishin

2019/12/21 01:07

文字コードによって順番は変わりますが、よほど古い処理系を想定するのでない限り、Unicode だと思って問題ないでしょう。 https://ja.wikipedia.org/wiki/%E7%89%87%E4%BB%AE%E5%90%8D_(Unicode%E3%81%AE%E3%83%96%E3%83%AD%E3%83%83%E3%82%AF) 上記のように、ダブルハイフンからコトまでがカタカナです。私はこれらすべて含めてカタカナとしていいと思いますが、[ァ-ヶー] を使ってもほとんどの場合は問題ないと思います。後は求められる仕様次第で増減するのが良いでしょう。
think49

2019/12/21 02:38 編集

文字コード誤認も考えましたが、Shift_JIS,ISO-2022-JP.EUC-JP,UTF-8,UTF-16の全てで [ァ-ン] ではなかったこと。 [ァ-ン] がいつの間にか、[ア-ン] に摩り替わっている事から、文字コードまで考慮した考えではないと判断しました。 質問文に追記された「[ア-ン] のテキスト画像」は転載元がはっきりしませんが、誤りでしかないので、参考になりません。
ikadzuchi

2019/12/24 12:50

お示しの画像に書かれている通り、[ア-ン]はアからンまでを指定できるが、ヴァなどが指定できません。 誤った例として書かれているのではないですか? (しかし「アからンまで、つまりカタカナ」と言ってしまっているのは、これがカタカナの定義だと言っているのだろうか。そのような定義は少なくとも実用的でないと思う。) > Zushinさん > 上記のように、ダブルハイフンからコトまでがカタカナです。 違います。それはUnicodeのカタカナブロックであって、Unicodeのブロックは文字の種類の定義とは別物です。
Zuishin

2019/12/29 05:43

またカタカナのオレオレ定義ですか。もうその終わった話は結構です。
Zuishin

2019/12/29 05:46

どうしても自分で定義したいのなら、その定義に従って Wikipedia を編集してきてください。
ikadzuchi

2019/12/29 06:07

名目上あなたへの返信の形をとっていますが、あなたがオレオレ定義をやめるとは思っていません。 誤った内容を信じてしまう人がいないよう注意書きとして書いています。
ikadzuchi

2019/12/29 06:16

Wikipediaに特に編集する理由を感じません。
Zuishin

2019/12/29 07:09

意味がわかってないのかな?
guest

回答3

0

なぜ順番を確認しないのでしょう?
「ァ」から始まって「ン」で終わるとどうして思ったのですか。

JavaScript

1console.log('ァ'.charCodeAt(0)); // 12449 2console.log('ヶ'.charCodeAt(0)); // 12534 3console.log('ン'.charCodeAt(0)); // 12531

Re: y_tantan さん

投稿2019/12/20 13:04

編集2019/12/20 13:05
think49

総合スコア18170

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

ベストアンサー

文字コードの並びは理解した上での質問と解釈しますが、
[ァ-ン]では「ヴ」が入らないので駄目でしょう。ふつう想定されるような用途に使いづらく、(少なくとも初心者には)お勧めしません。
[ァ-ヴ]なら「ヵ」「ヶ」をカタカナに含むかどうかの考え方の違いとしてどちらもありだと思います。
またヷヸヹヺを含んだ[ァ-ヺ]も考えられます。

投稿2019/12/20 13:15

編集2019/12/29 08:01
ikadzuchi

総合スコア3047

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

y_tantan

2019/12/29 05:22

仰る通り、「[ア-ン]はアからンまでを指定できけれどヴァなどが指定できない」と注意書きで書いてありました。 お答えいただいた皆様、ありがとうございました。
Zuishin

2019/12/29 05:51

ヴが入らないとダメという定義ならウに濁点が含まれていないのでダメですね。
ikadzuchi

2019/12/29 06:06

> ウに濁点が含まれていないのでダメ おっしゃっている意味が分かりません。
Zuishin

2019/12/29 07:05

> [ァ-ン]では「ヴ」が入らないので駄目でしょう。 [ァ-ヴ] で濁音が網羅できますか? どの濁音を入れるかは設計で各自行うべきもので、この濁音は不要だけどこの濁音を入れないと「駄目でしょう」とあなたが押し付けるものではありません。 https://tama-san.com/combining_character_sequence/
ikadzuchi

2019/12/29 08:01

ああ、「ウ」+「combining濁点」のことですか。 >ウに濁点 > 「駄目でしょう」とあなたが押し付けるものではありません。 それもそうです。表現を改めました。
Zuishin

2019/12/29 08:45

> OS X のフォルダやファイルなどの名称は、手入力をした場合でも、自動的に結合文字列にできる文字すべてが結合文字列に変換されます。 ふつう想定される用途ですね。
Zuishin

2019/12/29 08:49

「ヴ」を含めず「゛」を含めるというのは、ふつう想定される用途ですね。
Zuishin

2019/12/29 08:51

必要とされる文字の範囲が決まっているので、初心者とベテランで変える意味はありません。誰が組むかではなく、必要な仕様によって決まります。
ikadzuchi

2019/12/29 09:13

ヴを含めず合成用濁点(日本語名思い出した)を含めるのを私は否定していません。 ただしガザダバパ行を含み、ヴを含めず合成用濁点を含めるのはふつう想定されないと思います。 初心者は必要性の薄い要件は無視して大半の要求を満たす簡単な仕様でプログラムを書くべきだと思います。
Zuishin

2019/12/29 09:32

それは使うところ次第でしょう。私が上げた例ではヴはデータとして有り得ないので入れる必要はありません。
ikadzuchi

2019/12/29 09:36

文章を読んでいただけないようなので、話は以上です。
Zuishin

2019/12/29 09:37

また外国人の名前がデータであればダブルハイフンや中黒、空白が必要になります。
ikadzuchi

2019/12/29 09:44

既に言っている内容以上に返す言葉はありません。
Zuishin

2019/12/29 09:57

> 文字コードの並びは理解した上での質問と解釈しますが、 この前提も間違っていることは明白で、質問の答えにもなっていない単なるオレオレ仕様の押し付けでしかない回答が「なんとなく」でベストアンサーというのはどうかと思いますね。 評価の数の通り、質問者さんの誤解を解いたのはこの回答ではなく think49 さんの回答ではないかと思います。
guest

0

正規表現エンジンによっては、直接「カタカナ」を指定できる場合があります。

ruby

1# rubyの鬼車はUnicode文字プロパティに対応 2/[\p{Katakana}ー]/

これを使うと、(コト)のような、見慣れないカタカナにもヒットさせられます。

投稿2019/12/21 00:20

maisumakun

総合スコア145208

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2019/12/21 02:11

何がヒットするのかちゃんと知らないと、使うのがちょっと怖いですねw
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問