回答編集履歴
2
fix
answer
CHANGED
@@ -27,11 +27,11 @@
|
|
27
27
|
|
28
28
|
で、なぜ日本語が3バイトなのかを説明しますと、UCS-2 で日本語と呼ばれる物は以下の物です。
|
29
29
|
|
30
|
-
|字種 |範囲
|
30
|
+
|字種 |範囲 |
|
31
|
-
|------------------|-------------|
|
31
|
+
|------------------|--------------|
|
32
|
-
|漢字 |0x4E00
|
32
|
+
|漢字 |0x4E00~0x9FA0|
|
33
|
-
|全角英数及びマーク|0xFF01
|
33
|
+
|全角英数及びマーク|0xFF01~0xFF5D|
|
34
34
|
|全角記号 |0xFFE3,0x818F|
|
35
|
-
|半角カナ |0xFF61
|
35
|
+
|半角カナ |0xFF61~0xFF9F|
|
36
36
|
|
37
37
|
上の表に当てはめると何れも3バイトである事が確認頂けるかと思います。つまり UTF-8 は多言語を ASCII コンパチブルに扱う為に生まれた革命的な符号化方式なのです。
|
1
fix
answer
CHANGED
@@ -31,7 +31,7 @@
|
|
31
31
|
|------------------|-------------|
|
32
32
|
|漢字 |0x4E00-0x9FA0|
|
33
33
|
|全角英数及びマーク|0xFF01-0xFF5D|
|
34
|
-
|全角記号 |
|
34
|
+
|全角記号 |0xFFE3,0x818F|
|
35
35
|
|半角カナ |0xFF61-0xFF9F|
|
36
36
|
|
37
37
|
上の表に当てはめると何れも3バイトである事が確認頂けるかと思います。つまり UTF-8 は多言語を ASCII コンパチブルに扱う為に生まれた革命的な符号化方式なのです。
|