質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
JavaScript

JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

Q&A

解決済

1回答

5994閲覧

サロゲートペア以外の文字で構成された文字列の抽出を正規表現で行いたい

sounisi5011

総合スコア697

JavaScript

JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

0グッド

1クリップ

投稿2015/11/28 09:54

編集2015/11/28 09:58

サロゲートペア以外の文字で構成された文字列の抽出処理を行いたいのですが、その正規表現をどう記述すれば良いのか不明なため、質問させていただきます。

まず、サロゲートペアに該当する文字の、JavaScriptにおける正規表現は以下になります。

JavaScript

1/[\uD800-\uDBFF][\uDC00-\uDFFF]/

そして、サロゲートペアの文字のみで構成された文字列にマッチする正規表現は、以下になります。
(正規表現のフラグは除いています)

JavaScript

1/([\uD800-\uDBFF][\uDC00-\uDFFF])+/

さて、これの逆。つまり、サロゲートペア以外の文字だけで構成された文字列にマッチする正規表現はどのように表現すれば良いでしょうか?

数字のみで構成される文字列、及び数字以外の文字のみで構成される文字列の正規表現は、以下のようにシンプルです。

JavaScript

1// 数字のみで構成される文字列の正規表現 2/[0-9]+/

JavaScript

1// 数字以外の文字のみで構成される文字列の正規表現 2/[^0-9]+/

これを実際のコードで利用すると、以下のようになります。

JavaScript

1var str = 'ANA309 x2864 Of2016 AHG7CF'; 2 3console.log(str.match(/[0-9]+/g)); 4// ['309', '2864', '2016', '7'] 5 6console.log(str.match(/[^0-9]+/g)); 7// ['ANA', ' x', ' Of', ' AHG', 'CF']

これと同じような処理を、数字ではなくサロゲートペアに対して行いたいと考えています。

JavaScript

1var str = '????野家で????食べたい'; 2 3console.log(str.match(/([\uD800-\uDBFF][\uDC00-\uDFFF])+/g)); 4// ['????', '????'] 5 6console.log(str.match( ... )); // この正規表現が分からない 7// ['野家で', '食べたい']

どのような正規表現を書けば、これが実現できるでしょうか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

サロゲートペア以外を範囲指定すればいいような気がするのですが。
[\u0000-\uD7FF\uE000-\uFFFF]+

投稿2015/11/28 10:17

catsforepaw

総合スコア5938

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

sounisi5011

2015/11/28 10:33

あー、言われてみれば確かに。その手がありましたね… ありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問