質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.51%

  • Unicode

    65questions

    Unicodeはエンコーディングの標準規格です。1つの文字コード体系で多国語の表現を可能にすることを目指して作られています。

CJK互換用文字「㌠」は何との互換目的?

解決済

回答 3

投稿

  • 評価
  • クリップ 1
  • VIEW 1,659

yuba

score 5126

一部界隈で話題の「㍾」「㍽」「㍼」「㍻」のように、各国コードに存在してしまっている文字だから互換性のためだけにUnicodeに収録されている組み文字(より正確には、互換分解可能な文字)がCJK互換用文字領域であると認識しています。

さてここで、「㌠」などの組み文字です。
これら単位名の組み文字はJISにもCP932にもMacJapaneseにも登場しません。Unicodeではじめて作られた文字になります。一体これは何との互換を目的にした文字になるのでしょうか?

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • ozwk

    2017/01/19 12:37

    後方互換性のための領域に、「後方」の規格に存在しない文字が入っているのはなぜか?ということですか?

    キャンセル

  • yuba

    2017/01/19 12:38

    はい、そうなります。

    キャンセル

回答 3

checkベストアンサー

+8

ご質問の㌠は、1991年のユニコード1.0.0版の時点ですでに収載されています (当時のコード表 p.156 (データ上は32ページ目) 参照)。現在ユニコードに収録されている組文字のほとんどが、このときすでに存在します。

ウィキペディアの解説によると、1980年代後半にXerox社内で構想された統一文字コードの案に、コンソーシアム (企業間協議会) が賛同したものが、ユニコードの最初の版の元になっています。各企業が、関係する業界で使われている文字セットを持ち寄ってユニコードに収録してもらったということですね (超要約。詳細はリンク先を読んで下さい)。

組文字は報道・出版業界でよく使われますが、たとえば日本の新聞社では1960-70年代からCTS化が始まっています。つまり、当時すでに㌠などの組文字を使うコンピュータシステムが存在していたので、そのシステムとの互換性のために組文字をユニコードに収録したのだと考えられます[1]。

通貨名の片仮名表記の組文字がないことに当事者からクレームが来たから文字を作った、ということではないです[2]。


[1] ちなみに、ユニコードが構想されたころはメインフレームが幅をきかせる時代で、パソコンは業界の主流ではないです (というか「パソコン」という言葉が使われだしたのがこのころ)。当初収録されたのは基本的にメインフレームの文字セットであったと考えられます。たとえばセント記号やポンド記号について全角形が別途収録されている (U+FFE0、U+FFE1) のも、これらの記号で全角形とそうでない形の字が区別されるようなシステムとの互換性に配慮したのでしょう。

[2] 通貨記号については、発行当事国からの提案によって新たにユニコードに収録されることはよくあります (ユニコードの最近のコード表 [PDF])。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/01/19 18:27

    パソコン視点でしか発想していませんでした。汎用機というプロプライエタリ文字コード環境があったんですよね。全角ポンドも疑問に思っていた文字の一つだったので、納得できました。

    キャンセル

  • 2017/04/07 23:49

    新聞社向けの文字コードだったのではという説、当たっていました。
    共同通信社が出していた新聞社向け共通コードのK-JISというのがあり、これに収載されています。
    http://www.iwatafont.co.jp/format/gaiji_pdf/kjis099-102w.pdf
    組文字についてはUnicodeの組文字と一致しているのでこれが由来ということで間違いなさそうです。

    キャンセル

+1

㌦などの通貨単位の組み文字をUnicodeに入れる際に、「うちの国の通貨はないのか」というクレームによっていろいろ増えてしまったのではないかと思われます。

今でも、国旗(独立紛争地域がやばい)や、絵文字(肌の色や、トランスジェンダーがらみがやばい)などで、元々にはなかった文字が増えまくったりしているので、それと同様ではないでしょうか。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/01/19 12:38

    ㌠についてはその説明がしっくりきます。国際的な公平性が目的と。

    では、「㌂」なんかはどう思われますか? 物理単位にそういうクレームを付けてくる国や地域はなさそうですし、そもそも物理単位も全然網羅されていません。「㍊」があるのにSI単位系の「パスカル」がないとか。

    キャンセル

  • 2017/01/19 13:42

    当時Unicode制定してた人の狭い範囲の基準で「必要だろう」ってなったものが入っているんだと思われますが…
    SI単位系の切り替わりが1992年、Unicodeがらみの作業はちょうどその直前くらい(1.0.0が1991年)なので。

    互換性領域に新規追加というのは、年号でも、「既存システムがUnicode 1文字を使って年号を表しているものがいまだにあるので、『互換性のために』新規コードポイント追加が必要」という人もいますし。

    キャンセル

-4

https://ja.m.wiktionary.org/wiki/㌠

通貨単位フランの補助通貨

こんなの、初めて見た。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/01/19 12:18

    えっと、回答ではないんですよね?(困惑

    キャンセル

  • 2017/01/19 12:26

    何かの互換じゃなくて、単位として新規にUnicodeに追加されただけなんじゃないでしょうか。

    キャンセル

  • 2017/01/19 12:43

    互換の必要もないのになぜUnicodeに、それも「互換用文字」に追加されたのか、というのが質問になります。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.51%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

  • 解決済

    8ビット文字列とUnicode文字列の違い

    Pythonの文字列は8ビット文字列とUnicode文字列というものがあるそうですが、どういったものですか。

  • 受付中

    【python】文字数カウント

    あるファイル(sample.txt)内の文字数(特定文字の出現回数)をカウントしたいと考えています. カウントに際しては, ・ひらがなの出現回数 ・漢字の出現回数 ・数字の出現回数

  • 解決済

    PostgreSQLでのSQL文

    お世話になっております。 SELECT * FROM hoge WHERE del_flg = 0  AND OCTET_LENGTH(CONVERT(convert_to(ho

  • 解決済

    VBScriptにおける禁止文字チェックについて

    JIS X 0208 から JIS X 0213で追加となっている文字を含んだ文字列を除外したのですがよい方法はありますか? よろしくお願いします。

  • 解決済

    pythonでマルチバイト文字の正規表現

    re.compile(  r"[A-Z]{2,}(?![a-z])|[A-Z][a-z]+(?=[A-Z])|[\'\w\-]+", re.UNICODE) この正規表現を、

  • 受付中

    mingwのmakeで文字化けする。

    前提・実現したいこと ここに質問したいことを詳細に書いてください (例)PHP(CakePHP)で●●なシステムを作っています。 ■■な機能を実装中に以下のエラーメッセージが

  • 解決済

    DjangoでNon-ASCII character エラーが出ます

    お世話になります。 win10,Anaconda2/3を使っています 下記のエラーが出ます 原因は何なのでしょうか?お教えください C:\Users\mtg-1\Pycha

  • 解決済

    macOSの文字コードについて

    お世話になります。 macOSsieraなどで使用されている標準の文字コードはunicodeだと思いますが、 波ダッシュを入力した時に「〜」と表示されるのはなぜでしょうか。 u

同じタグがついた質問を見る

  • Unicode

    65questions

    Unicodeはエンコーディングの標準規格です。1つの文字コード体系で多国語の表現を可能にすることを目指して作られています。