コンピュータで文字を表現するには表現したい文字をすべて一つのダブりなくコンピュータが分かる2進数に対応させないといけない。そして、Unicodeは表現したい文字の集合ってだけだからそのUnicodeに含まれる文字すべてをダブりのない2進数(これをcode pointと言う)に対応させないといけない。どういう対応規則を使うかが、utf-8,utf-16の違いである。と言うところまでは一応理解しました。
ところが、Unicode code pointsなるものが存在することを知りました。Unicodeは文字の集合なわけですからUnicode code pointsとは何なのかわからなくなりました。
Unicodeにcode pointsがあるならutf-8もutf-16もいらない気がするのですがどういうことなのでしょうか?
Unicode code pointsとutf-8のcode points、utf-16のcode pointsは何が違うのでしょうか?
結局、Unicodeは「文字の集合」なのか「文字の集合+対応規則」なのかどちらなのでしょうか?
code pointsがあるということは(それらは対応規則によって生成されているわけだから)対応規則があるということでUnicodeは「文字の集合+対応規則」ということになるのでしょうか?
回答3件
あなたの回答
tips
プレビュー