入力文字のカウント　charCodeAt()について

入力された文字のカウントをする際、
charCodeAt()で1文字ずつ判別して、半角なら◯文字分、全角なら◯文字分とするコードですが、

if( (chr >= 0x00 && chr < 0x81) || (chr === 0xf8f0) || (chr >= 0xff61 && chr < 0xffa0) || (chr >= 0xf8f1 && chr < 0xf8f4) )

の意味がよくわからないです。

charCodeAt()メソッドはUTF-16コードユニットを表す 0 から 65535 までの整数を返すのでは？
例えば、a という文字列なら charCodeAt()での返り値は 65
0x00,0x81,0xf8f0... この多分UTF-８の文字列と比較しているのがよくわからないのですが

JavaScript
1for(var i=0; i<str.length; i++){
2    var chr = str.charCodeAt(i);
3    if( (chr >= 0x00 && chr < 0x81) || 
4        (chr === 0xf8f0) || 
5        (chr >= 0xff61 && chr < 0xffa0) || 
6        (chr >= 0xf8f1 && chr < 0xf8f4) )
7    {
8        //半角文字
9    } else {
10        //全角文字
11    }
12}

行動規範の内容に同意します

回答2件

0x で始まるのは16進数表記です

16進数で　00～81、f8f0　etc...　が半角文字のコードに
該当するので使用されている判別式です。

投稿2021/02/09 04:47

YTani0317

総合スコア34

pinoko

2021/02/09 07:13

ご回答ありがとうございます。疑問なのですが、charCodeAt()の返り値であるUTF-16コードユニットの番号で半角コードの範囲を絞るというのは現実的ではないのですか？何故、16進数なのでしょうか？

行動規範の内容に同意します

ベストアンサー

chr < 0x81はchr < 129と全く一緒の意味です。

js
1const a = 0x81;
2const b = 129;
3
4console.log(a === b); // true

投稿2021/02/09 07:50

ozwk

総合スコア13553

pinoko

2021/02/09 08:16

ご回答ありがとうございます。それは数値を取り扱う際に、任意桁の数をコンパクトに表現する為の手段として可変長数値表現をしているつまり10進数を16進数で表現（記述）しているということでしょうか？ 16進数で 00～81 が半角文字のコードに該当するっていうのは、どこかに16進数に対する文字コード対応一覧表でもあるのでしょうか？検索の方法が悪いのか、理解があやふやからなのか、どうもそれらしいものが見当たらないのですが

YTani0317

2021/02/09 09:01

コンピュータ内部で扱われるバイト単位表記が、１０進数よりも１６進数の方が桁数の扱いなどで親和性が高いため用いられているのではないかと。 00～81のコードに関してはASCIIコードで検索してみましょう。

pinoko

2021/02/09 10:11

いろいろありがとうございました。 charCodeAt()メソッドの最初の128のUnicodeコードポイントが、ASCII 文字エンコーディングに直接対応してて、0xff61 ～ 0xffa0がUnicodeの半角カタカナということですね。おかげさまでだいたい理解することが出来ました。

行動規範の内容に同意します

あなたの回答