文字化けはなぜ起こるのか

回答率: 85.48%

質問するログイン新規登録

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

新規登録して質問してみよう

ただいま回答率: 85.48%

トップ UTF-8に関する質問

Q&A

解決済

1回答

1093閲覧

文字化けはなぜ起こるのか

総合スコア201

0グッド

0クリップ

投稿2017/12/18 18:04

0

0

抽象的な質問ですみません。　文字化け　とはなぜ起こるのでしょうか？
文字コード(UTF-8など）の違いによって起きたりする　と言うのはわかるのですが、
数字とかアルファベットになるならまだしも、なぜ「譁�ｭ怜喧縺�」みたいな漢字になるのでしょうか？
例えば、「縺」はもつれる　という意味ですが、文字化けと何か関係があるのでしょうか？

行動規範の内容に同意します

回答1件

0

ベストアンサー

利用している環境によって「どのような文字セット」を扱おうとしているかが決まります。

この場合の文字セットとは以下の意味合いを含みます。

(1) 扱おうとしている文字の種類
(2) バイトの列と(1)の間の写像

(1)は例えば「英字・数字・記号・漢字」といった文字の種類です。
(2)は0x30<->'0', ..., 0x41<->'A', 0xE7 0xB8 0xBA<->'縺', ...などといったバイト列と特定の文字の対応関係の定義です。(2)のことを文字エンコーディングといったりもしますね。

さて文字化けとは「バイト列と文字の間の写像（変換）」をする際に(2)が本来意図したものと違うために誤った写像が行われることです。文字＝＞バイト列への変換、バイト列＝＞文字への変換のどちらも有りえます。

バイト列＝＞文字への変換での文字化けを想定しますと・・・

例えば利用環境で想定している文字セットが「ASCII」の場合「あり得る文字、つまり上記の(1)は、英数字・一部の記号」のみですので文字化けが起こった場合、結果もまた英数字や一部の記号のみになります。

一方「UTF-8などのUNICODE」あるいは「ShiftJIS」のように「漢字を含む文字セット」を想定した環境では(1)の中に漢字が含まれています。そのため文字化けにより誤って解釈された結果が「漢字」になる可能性もあるわけです。

ということで結論は「文字化けの結果が漢字になることがある」理由は「想定環境の文字セットに漢字が含まれているから」です。

投稿2017/12/18 20:29

総合スコア18394

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問

トップ UTF-8に関する質問

文字化けはなぜ起こるのか

関連した質問

同じタグがついた質問を見る

運営からのお知らせ

【サポート業務のお知らせ】ゴールデンウィーク休業につき下記の日程で、お問い合わせ等のサポート業務をお休みいたします。 2024/04/27(土)~2024/04/29(月) 2024/05/03(金)〜2024/05/06(月) なお期間中もサポートへのお問い合わせは受け付けております。

【重要なお知らせ】いつもteratailをご利用いただきありがとうございます。現在、認証システムの修正により、一部のユーザーが強制的にログアウトされる可能性がございます。お手数おかけしますが、再度ログインを行なっていただきますよう宜しくお願いいたします。ご不便をおかけし申し訳ございません。

過去のお知らせを見る