前提:一文字の定義は
http://unicode.org/faq/char_combmark.html#7
によると4つあるようですが、ここでは上記URLの4つ目、Grapheme clustersを指します。
combining characterのように一文字が複数のcodepointで表されることがありますが、そういった可能性があるcodepointのリストみたいなものはありますか?もしくはその範囲を教えてください。
例えば
- Combining Diacritical Marks (0300–036F), since version 1.0, with modifications in subsequent versions down to 4.1
- Combining Diacritical Marks Extended (1AB0–1AFF), version 7.0
- Combining Diacritical Marks Supplement (1DC0–1DFF), versions 4.1 to 5.2
- Combining Diacritical Marks for Symbols (20D0–20FF), since version 1.0, with modifications in subsequent versions down to 5.1
- Combining Half Marks (FE20–FE2F), versions 1.0, with modifications in subsequent versions down to 8.0
Wikipedia(en)にはこういう記述がありますが、絵文字やら考えるとこれだけではないはずです。
回答1件
あなたの回答
tips
プレビュー