回答率: 85.29%

質問するログイン新規登録

トップ Windowsに関する質問 ASCIIコードと文字コードについて

編集履歴

回答編集履歴

2

修正

2016/03/17 05:56

投稿

スコア21596

answer CHANGED Viewed

@@ -6,6 +6,7 @@
 流石にそれは不便だという事でShift-JIS, EUC-JP, UFT-8等の文字コードが次々と登場しましたが、
 これらはASCII文字をベースに拡張されています。
+（ASCII文字をベースとしなかった文字コードも多数存在します。）
 以下は例としてのShift-JISの実装の一例です。
 ASCII文字は7bitで成り立っているので、先頭に0の1ビットを足して8ビットとして管理、
@@ -14,5 +15,5 @@
 （ただし、1bit目が1であっても特定の値は半角カナとして取り扱う）
 「Shift-JIS, EUC-JP, UFT-8」というASCII文字をベースとして拡張された文字コードに関しては、
-文字化けせずに保たれることが確認出来ます。
+相互に変換をかけても、ASCII文字に関しては文字化けせずに保たれることが確認出来ます。
 その辺の事情で、ASCIIという文字コードを普段意識することは無いかと思います。

1

例外等補足

2016/03/17 05:56

投稿

スコア21596

answer CHANGED Viewed

@@ -5,14 +5,14 @@
 お前らも英語でやれよと突っぱねる形式となっていました。
 流石にそれは不便だという事でShift-JIS, EUC-JP, UFT-8等の文字コードが次々と登場しましたが、
-全てASCII文字をベースに拡張されています。
+これらはASCII文字をベースに拡張されています。
-詳しい事は控えますが、（知らないのは内緒）
+以下は例としてのShift-JISの実装の一例です。
 ASCII文字は7bitで成り立っているので、先頭に0の1ビットを足して8ビットとして管理、
 そして先頭の1ビット目が1で固定させた8ビットの塊を先頭に付ける事で約3万文字の拡張…というやり方で実装されています。
 文字の先頭1ビット目を確認すれば、これはASCII文字か、次の1バイトを更に読み込んで2バイト文字として読み込むかを分岐させて判別しています。
-（UTF-8はユニコードの実装の一つで、3〜4Byteに跨る大量の文字が定義されています。)
+（ただし、1bit目が1であっても特定の値は半角カナとして取り扱う）
-このような実装なので、「Shift-JIS, EUC-JP, UFT-8等」の文字コードを相互に変換しても、
+「Shift-JIS, EUC-JP, UFT-8」というASCII文字をベースとして拡張された文字コードに関しては、
-ASCII文字の部分は文字化けせずに保たれている事が分かるかと思います。
+文字化けせずに保たれることが確認出来ます。
-その辺の事情で、ASCIIという文字コードを意識することは無いかと思います。
+その辺の事情で、ASCIIという文字コードを普段意識することは無いかと思います。