質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

Q&A

解決済

1回答

1450閲覧

PHPプログラム内部で使われる文字コードの決まり方について

ms90

総合スコア39

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

0グッド

1クリップ

投稿2017/06/21 08:47

php

1 2<?php 3#/var/www/html/detect.php 4#detect.phpはUTF-8で書かれているとする。 5$moji = "漢字"; 6mb_detect_encoding($_GET['address']);//(1) UTF-8 7mb_detect_encoding($moji);//(2)UTF-8

ブラウザより__http://example.com/detect.php?address=%E5%A4%A7%E9%98%AA __としてアクセスすると
(1)、(2)「UTF-8」と表示されるのはスクリプトがUTF-8で書かれているからなのでしょうか?
php.iniの設定により変更される部分なのでしょうか?
それともリクエストのヘッダで決まるのでしょうか?

お知恵を貸していただけませんか

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

(1)がUTF8なのは「%E5%A4%A7%E9%98%A」がUTFの文字(大阪?)をurlencodeしたものだからです。
(2)は適当だと思われる漢字コードをなんとなく表示してくれています。
エディタで保存するときの文字コード指定によりますが、特定する情報が少なければ
かならずしも正しい値は返ってきません。

mb_detect_encoding($moji,"UTF-8,SJIS,EUC-JP");
のように候補を挙げておくと精度がややあがります

投稿2017/06/21 09:24

yambejp

総合スコア114585

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

ms90

2017/06/22 03:24

yambejpさん回答ありがとうございます。 (1)はUTF-8でURLエンコードされている文字列を投げているわけですからそうなるわけですね。納得しました。 (2)はある符号化された文字が異なる文字エンコーディングで同一の場合判別するすべがないということですよね。 クライアントからのリクエストされた文字データの文字エンコーディングを知る術はないのでしょうか? mb_convert_encoding()など使う際にも変換元の文字エンコーディングを指定する必要がありますよね。 そのため変換元の文字エンコーィングは正確にしっておかなければいけないといけないと思うのですが認識に誤りがあるのでしょうか?。
yambejp

2017/06/22 03:50

むしろ逆だと思います つまりユーザーが送ってくる際のフォームのページはサーバーから提供するわけですから header("Content-Type:text/html;charset=utf-8"); など指定してキャラクターセットを渡すわけです。 なのでform内にhiddenでいいので <input type="hidden" name="charset" value="utf-8"> などを埋め込んでおけば、ユーザーから送られてくるキャラクターセットを 想定することができるわけです 結局予測がつかない場合はmb_internal_encoding()から提案されることになると思います (その元はphp.iniのデフォ値?)
ms90

2017/06/26 09:32

Webページから送られてくる文字列はWebページの文字エンコーディングに依存 そしてこれはサーバ側がコントロールできるわけということですね。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問