##質問
linuxが文字を理解する時の流れの仮説は正しいか?
【linuxが文字を理解する時の流れの仮説】($LANGにutf-8が設定されている場合)
**1.**読み取ろうとするファイルの中身(バイナリデータ)を、環境変数$LANGに設定されている文字コード対応表と照らし合わせて文字変換する。
**2、**対応表には主な文字コードデータのBOM情報が含まれており、もしBOMが記載されていた場合はその文字コードで変換をし直す。(「Shift_JIS」という文字をutf-8で読み取ったときのデータは「432432(適当)」となるのでもし「432432」という文字がファイルの最初の方に書かれていたらShift_JIS対応表で変換し直す)
--BOMが記述されていた場合はここで終わり--
**3、**linuxにはある程度文字化けしているかを確認できる機能がついていて、読み取ったデータにBOMがなく更にutf8で変換してみたものの文字化けしていると判断された場合には他の文字コードでいくつか変換してみる。
**4、**変換した結果文字化けが最も無いと判断された文字コードでそのファイルを表示する。
##背景
私はqiitaの記事を読み、また自らの実験結果や経験とともにlinuxが文字を理解するときの流れについて一つの仮説を立てました。
回答5件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/09/05 10:22
2018/09/07 01:36 編集
2018/09/07 00:25