🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
JavaScript

JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

Q&A

解決済

2回答

3865閲覧

入力文字のカウント charCodeAt()について

pinoko

総合スコア127

JavaScript

JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

0グッド

0クリップ

投稿2021/02/09 04:35

入力された文字のカウントをする際、
charCodeAt()で1文字ずつ判別して、半角なら◯文字分、全角なら◯文字分とするコードですが、

if( (chr >= 0x00 && chr < 0x81) || (chr === 0xf8f0) || (chr >= 0xff61 && chr < 0xffa0) || (chr >= 0xf8f1 && chr < 0xf8f4) )

の意味がよくわからないです。

charCodeAt()メソッドはUTF-16コードユニットを表す 0 から 65535 までの整数を返すのでは?
例えば、a という文字列なら charCodeAt()での返り値は 65
0x00,0x81,0xf8f0... この多分UTF-8の文字列と比較しているのがよくわからないのですが

JavaScript

1for(var i=0; i<str.length; i++){ 2 var chr = str.charCodeAt(i); 3 if( (chr >= 0x00 && chr < 0x81) || 4 (chr === 0xf8f0) || 5 (chr >= 0xff61 && chr < 0xffa0) || 6 (chr >= 0xf8f1 && chr < 0xf8f4) ) 7 { 8 //半角文字 9 } else { 10 //全角文字 11 } 12}

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

0x で始まるのは16進数表記です

16進数で 00~81、f8f0 etc... が半角文字のコードに
該当するので使用されている判別式です。

投稿2021/02/09 04:47

YTani0317

総合スコア34

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

pinoko

2021/02/09 07:13

ご回答ありがとうございます。 疑問なのですが、charCodeAt()の返り値であるUTF-16コードユニットの番号で半角コードの範囲を絞るというのは現実的ではないのですか? 何故、16進数なのでしょうか?
guest

0

ベストアンサー

chr < 0x81chr < 129と全く一緒の意味です。

js

1const a = 0x81; 2const b = 129; 3 4console.log(a === b); // true

投稿2021/02/09 07:50

ozwk

総合スコア13551

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

pinoko

2021/02/09 08:16

ご回答ありがとうございます。 それは数値を取り扱う際に、任意桁の数をコンパクトに表現する為の手段として可変長数値表現をしている つまり10進数を16進数で表現(記述)しているということでしょうか? 16進数で 00~81 が半角文字のコードに該当するっていうのは、どこかに16進数に対する文字コード対応一覧表でもあるのでしょうか? 検索の方法が悪いのか、理解があやふやからなのか、どうもそれらしいものが見当たらないのですが
YTani0317

2021/02/09 09:01

コンピュータ内部で扱われるバイト単位表記が、10進数よりも16進数の方が 桁数の扱いなどで親和性が高いため用いられているのではないかと。 00~81のコードに関してはASCIIコードで検索してみましょう。
pinoko

2021/02/09 10:11

いろいろありがとうございました。 charCodeAt()メソッドの最初の128のUnicodeコードポイントが、ASCII 文字エンコーディングに直接対応してて、0xff61 ~ 0xffa0がUnicodeの半角カタカナということですね。 おかげさまでだいたい理解することが出来ました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問