質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

91.26%

  • 文字コード

    159questions

    文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

文字コードという言葉について

解決済

回答 2

投稿

  • 評価
  • クリップ 0
  • VIEW 170

strike1217

score 492

プログラミングでもよく耳にする「文字コード」という言葉に付いてなのですが・・・
一般的に「文字コード」と言われたら、どちらを指す言葉なのでしょうか??

符号化文字集合?  符号化方式?

いいから聞け! 俺が文字コードについて教えてやるよ その1
ここによりますと、

大まかに言えば、「文字コード」は文字に割り当てられた「数字」のことで、
「エンコード」は文字と数字をマッピングする「方式」のことだと捉えていれば、大きくは外れません。
ただ、「文字コード」という言葉は、「数字」「方式」の両方で使われるほか、
文字一覧を示す「Charset」という意味で使われることもあります。

文字コード = 割り当てられた数字のこと。つまり、文字集合でもエンコーディングのどちらでもないということでしょうかね?

「charset」という意味でも使われることもあります。

????つまり文字集合ですよね??

「数字」「方式」の両方で使われる

????? え??エンコーディングの方でも使われているの???

結局何を指す言葉なのか分かりません。

ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
また、ASCIIコードはどちらに属するものなのでしょうか??
文字コードUTF-8とは〜世界で最もポピュラーな文字コードとその仕組みを学ぼう
こちらだと、符号化方式の方かな?

符号化文字集合と文字符号化方式の違い
こちらだと、符号化集合の方に属していると述べています。

しかし、ASCIIコードは文字コードですよね??
結局、どちらにも属さないのか、どちらに属すのか、それとも両方の事なのかよくわかりません。

この辺り言葉の定義がよくわからなすぎて、何を指して話をしているのか困惑します。
わかる方教えてください。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 2

+2

端的にいえば、「符号化文字集合」と「符号化方式」は独立ではないので、その暗黙の関係からだいたい決まります。

例えば、符号化方式として使われる「シフトJIS」は、文字集合として、「JIS X 0201+(JIS X 0208 or JIS X 0213)」を前提としています。「UTF-8」「UTF-16」なども、「Unicode」用の符号化形式です。

そして、文字集合は数学的な集合と違って、順番まで決めておかないと役に立たないので、「文字集合」といっても番号は振ってあります(例えば、和字間隔 は、JIS X 0208においては「1区1点」という抽象的なコードで、Unicodeでは「U+3000」というUTF-32での表現と同じコードで振ってあります)。

「ASCIIの符号集合をそのまま7ビット領域に入れる」という符号化方式も、略して「ASCII」と呼ばれます。

あと、「集合としての文字コード」は別に、(特定の文字集合・符号化方式で)特定の文字について符号化された値のことを「文字コード」ということもあります(「文字コード入力」なんてのもありますし)。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/12/12 12:04

    文字集合の方にも番号が振ってあるのですね!

    ASCIIという言葉は、文字集合、符号化方式の両方を指す言葉・・・ということですか?
    「文字コード」という言葉は「総称」ということでしょうか?

    キャンセル

  • 2017/12/12 13:36

    どれを意味するかは、文脈から取ってください。

    キャンセル

  • 2017/12/12 17:36

    ああ、なるほど!

    キャンセル

  • 2017/12/12 17:38

    複数の意味があるのですね。
    わかりにくい。

    キャンセル

checkベストアンサー

+1

本来は、「"A"の文字コードは、ASCIIでは64だが、EBCDICでは193だ」という文で使われるような意味です。

文字集合のまぎれのない例は、JIS-X0208とかユニコードですね。
それぞれエンコーディング方式が複数あるので。
US-ASCIIだと文字集合とエンコーディングの両方を規定している。

今だと、エンコーディングの意味で使われる事が多いと思います。
エンコーディングが複数あり得る文字集合の意味で使われる事は少ないのではないかと。
「文字コードはJISです」と聞いた場合、まず間違いなく「エンコーディングはISO-2022-JPです」という意味です。

Windowsのメモ帳の保存ダイアログの表示も混乱の元ですね。「ANSI」とか「Unicode」とか。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/12/12 17:36

    > 文字集合とエンコーディングの両方を規定している。
    ああ、そうなんですか!

    「文字コードはunicodeです。」という言い方はするのでしょうか?
    あまり聞かないようなーー

    キャンセル

  • 2017/12/12 17:37

    > 今だと、エンコーディングの意味で使われる事が多いと思います。

    どちらかというと
    「文字コード」= 「エンコーディング」のほうが自然ということですかね。

    キャンセル

  • 2017/12/12 20:36

    > 「文字コードはunicodeです。」という言い方はするのでしょうか?

    一般的には、unicodeは「エンコーディングを規定しない文字集合」なので、言わないでしょう。
    言うのは、Windowsのメモ帳でUTF-16LEで保存して欲しいときくらいでしょうか。

    キャンセル

  • 2017/12/12 21:35

    asciiは文字集合とエンコーディングの両方を規定している。
    「文字コード」= エンコーディングと考える方が自然

    ということですね。
    わかりました。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

ただいまの回答率

91.26%

関連した質問

同じタグがついた質問を見る

  • 文字コード

    159questions

    文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。