質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

88.10%

mb_convert_encodingで文字化けする

受付中

回答 6

投稿

  • 評価
  • クリップ 3
  • VIEW 33K+

score 152

PHPで、日本語をmb_convert_encodingを使って文字コード変換してるのですが、
なぜか文字化けしてしまい、原因が分からず困っています。

今、UTF-8からSJIS-winへの変換をおこなっていますが、文字化けしてしまいます。


具体的には下記のようなコードを使っています。

$str = "ほげ";
$str = mb_convert_encoding($str, "SJIS-win", "UTF-8");

echo $str;
このようにしても、"ほげ"は表示されず、ひし型の「?」のような文字列で文字化けしています。
元の"ほげ"ってのがUTF-8じゃないのか?とおもって、mb_detect_encoding($str)をしてみましたが、これは正しく"UTF-8"と表示されました。

完全に原因が分からず困ってます。。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 6

+1

ブラウザのエンコーディングが「自動検出」になっていれば
header("Content-type: text/html charset=Shift_JIS");
だけで大抵はいけるようですが、Chromeさんは頑固みたいです。(wibkit的な話ならSafariもかな…?)

<?php

    $str = "ほげ";

    $str = mb_convert_encoding($str, "SJIS-win", "UTF-8");

    header("Content-type: text/html charset=Shift_JIS");
    echo "<html><head><meta charset='Shift_JIS'></head><body>";
    echo $str;
    echo "</body></html>";

ここまではっきり書いてもダメなら別の問題ですね。

ちなみに、SJIS-winって、Windows-31JのPHPでのエイリアスなので、

header("Content-type: text/html; charset=SJIS-win");

これはダメなんじゃないかな…

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2015/04/13 17:45

    SJIS-win、他の人とかぶりましたね…

    キャンセル

0

mb_detect_encodingがutf8ならソースファイルの文字コードはutf8なんでしょうから、実行環境のコマンドプロンプト等のCLI環境の文字コードに問題があるのでは?
http://www.adminweb.jp/command/display/index5.html

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0


mb_convert_encording($str,"SJIS-win", "ASCII,JIS,UTF-8,EUC-JP,SJIS");

と書いてやればできたと思います。
後ろがAUTOだと問題があったりしがちのはずです。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2015/04/13 16:23

    ありがとうございます。
    これでやってみても結果は同じでした。。

    キャンセル

0

CLIで実行していますか? Webサーバから実行していますか?

internal_encodingとファイルのエンコーディングは合っていますか?

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2015/04/13 16:25

    webサーバで実行しています。

    internal_encoding、ファイルのエンコーディング共に`UTF-8`でした。

    キャンセル

  • 2015/04/13 16:27

    そしたら、<meta http-equiv="Content-Type" content="text/html; charset=SJIS" >を<head>の直後あたりで出力しないと、ブラウザがSJISが出てるってわからないですよね。

    キャンセル

0

PHPはデフォルトの環境で運用しているならば、ソースコード中で明示して出力しない限り、レスポンスヘッダーのContent-Typeにデフォルトで文字コードをUTF-8で出力します。

もし、SJISでテキストを出力したいのであれば、以下のコードを全ての出力に先だって配置して、出力してみてください。 レスポンスヘッダーのContent-Typeの文字コードにSJISを指定する記述となります。

header("Content-type: text/html; charset=SJIS-win");

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2015/04/13 15:33

    あ、ごめんなさい。ひし型の「?」のようなって書いてますね...Content-Typeの問題かも...

    キャンセル

  • 2015/04/13 16:29

    ありがとうございます。

    参考に下記のようにしてみましたが、出力は「」でした。。

    ```
    $str = "ほげ";
    $str = mb_convert_encoding($str,"SJIS-win", "UTF-8");
    header("Content-type: text/html; charset=SJIS-win");
    echo $str;
    ```

    キャンセル

  • 2015/04/13 17:37

    charset=SJIS-winじゃダメじゃないでしょうか。
    charset: SJISでないと。

    キャンセル

0

webサーバで実行してるんですよね。
mb_detect_encoding($str)がUTF-8になるということなので、phpファイルのエンコーディングもUTF-8と推察されます。
そこでSJISの文字をechoしてるから文字化けするんじゃないでしょうか。

具体的な検証としては
$str = "ほげ";
$str = mb_convert_encoding($str, "SJIS-win", "UTF-8");

file_put_contents("hoge.txt", $str);

生成されるhoge.txtの中身を見てみてください。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 88.10%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る