質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.52%

  • PHP

    20288questions

    PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

  • 文字コード

    205questions

    文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

内部文字エンコーディングとは何なのか

解決済

回答 2

投稿

  • 評価
  • クリップ 0
  • VIEW 503

aaaaaaaa

score 466

マルチバイト文字列関数(mbstreng)のなかにmb_internal_encodingという文字コードの初期値をきめる関数があります。
こちらをみると設定する初期値を内部文字エンコーディングと呼んでいます。
マルチバイト文字列関数を利用する際の初期値の文字コードとは言わずに、内部文字エンコーディングと呼ぶ理由は何なのでしょうか。
そもそも、内部文字エンコーディングとは、何なのでしょうか。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 2

checkベストアンサー

+3

mbstring.internal_encodingという
php.iniの設定値のことです。
日本語直訳気味に表現して「内部文字エンコーディング」と呼んでいるのだと。

マルチバイト文字列 関数群がテキストを扱うときに参照され、
エンコーディングを関数の引数でいちいち設定しなくても処理できるようにしているもののようです。

なお、mb_internal_encoding()という関数は、実行時にmbstring.internal_encoding設定値を変更したり取得したりできるものです。

そもそもマルチバイト文字列とは、
PHP: はじめに - Manualにも解説がありますが、
一つの文字を1バイトデータでは表現できない場合複数のバイトデータの連結で表現するものなのです。
エンコードによっては、1バイトのときもあれば2バイトのときもあれば4バイトのときもあったりします。(あくまで一例)
文字列の一部分を切り出したり置き換えたりなど加工するときに
文字列データを破壊せずバイトデータの境目を適切に認識するために必要な情報(←エンコード情報)を、
都度mbstring系関数の引数で与えてもよいのですが、
コード量(文字タイプ数)を削減したり可読性を向上したりするために、
指定がない場合はエンコーディングをどう扱うかというルールを決めているだけのことです。
それを日本語直訳気味に表現すると「内部文字エンコーディング」になるのかなと。

内部、としているのは、PHPの中のこと(ファイルやHTTPリクエストやHTTPレスポンスじゃない)だからかなぁ。

この回答を書く前に、mbstring実装の歴史的背景を調べようとしたけど、
時間が足りず。

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/06/29 19:10

    ご回答ありがとうございます。
    PHPの中というのは、PHPのエンジンであるzendのことですか。

    キャンセル

  • 2018/07/14 18:07

    んーと、zendっていうか、PHPインタプリタさん。

    つまり、PHPインタプリタさんが、「我々はこのエンコーディングを公用語とする」と宣言するするのがmb_internal_encodingになる。

    だから、プログラムの中に記述されたストリングリテラルは、その公用語で書かれている前提になる。

    今、こんなteratail.phpというファイルがUTF-8で保存されている。
    <?php
    $text = "みんなの大喜利会場『テラテイル』";

    mb_internal_encodingが"UTF-8"であるとする。
    PHPインタプリタさんにはこう見える。
    <?php
    $text = "みんなの大喜利会場『テラテイル』";

    mb_internal_encodingが"cp932"であるとする。
    PHPインタプリタさんにはこう見える。
    <?php
    $text = "縺ソ繧薙↑縺ョ螟ァ蝟懷茜莨壼エ縲弱ユ繝ゥ繝・う繝ォ縲・;

    Could u understand?

    キャンセル

  • 2018/07/14 19:57

    そうそう、んで言い忘れてたんだけど、
    mb_ナンチャラってやつに関しては、
    mb_ナンチャラって書いてある関数にしか影響しないです。

    だから上の例で行くと、
    縺ソ繧薙↑縺ョ螟ァ蝟懷茜莨壼エ縲弱ユ繝ゥ繝・う繝ォ縲・
    っていうのは正確には、mb_ナンチャラ関数からの視界ですね。

    今頃追記しておきます。

    キャンセル

  • 2018/07/19 13:30

    ご返信ありがとうございました。

    キャンセル

0

「初期値」は参照するときの話で、設定するときは内部エンコーディングを
変更しているという認識がわかりやすいのでは?

もちろん内部エンコーディングを変えたあと参照すれば、それはもう
初期値ではないのですけどね。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.52%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る

  • PHP

    20288questions

    PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

  • 文字コード

    205questions

    文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。