サロゲートペア以外の文字で構成された文字列の抽出処理を行いたいのですが、その正規表現をどう記述すれば良いのか不明なため、質問させていただきます。
まず、サロゲートペアに該当する文字の、JavaScriptにおける正規表現は以下になります。
JavaScript
1/[\uD800-\uDBFF][\uDC00-\uDFFF]/
そして、サロゲートペアの文字のみで構成された文字列にマッチする正規表現は、以下になります。
(正規表現のフラグは除いています)
JavaScript
1/([\uD800-\uDBFF][\uDC00-\uDFFF])+/
さて、これの逆。つまり、サロゲートペア以外の文字だけで構成された文字列にマッチする正規表現はどのように表現すれば良いでしょうか?
数字のみで構成される文字列、及び数字以外の文字のみで構成される文字列の正規表現は、以下のようにシンプルです。
JavaScript
1// 数字のみで構成される文字列の正規表現 2/[0-9]+/
JavaScript
1// 数字以外の文字のみで構成される文字列の正規表現 2/[^0-9]+/
これを実際のコードで利用すると、以下のようになります。
JavaScript
1var str = 'ANA309 x2864 Of2016 AHG7CF'; 2 3console.log(str.match(/[0-9]+/g)); 4// ['309', '2864', '2016', '7'] 5 6console.log(str.match(/[^0-9]+/g)); 7// ['ANA', ' x', ' Of', ' AHG', 'CF']
これと同じような処理を、数字ではなくサロゲートペアに対して行いたいと考えています。
JavaScript
1var str = '????野家で????食べたい'; 2 3console.log(str.match(/([\uD800-\uDBFF][\uDC00-\uDFFF])+/g)); 4// ['????', '????'] 5 6console.log(str.match( ... )); // この正規表現が分からない 7// ['野家で', '食べたい']
どのような正規表現を書けば、これが実現できるでしょうか?
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2015/11/28 10:33