質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.47%

  • MySQL

    6034questions

    MySQL(マイエスキューエル)は、TCX DataKonsultAB社などが開発するRDBMS(リレーショナルデータベースの管理システム)です。世界で最も人気の高いシステムで、オープンソースで開発されています。MySQLデータベースサーバは、高速性と信頼性があり、Linux、UNIX、Windowsなどの複数のプラットフォームで動作することができます。

  • JSON

    1206questions

    JSON(JavaScript Object Notation)は軽量なデータ記述言語の1つである。構文はJavaScriptをベースとしていますが、JavaScriptに限定されたものではなく、様々なソフトウェアやプログラミング言語間におけるデータの受け渡しが行えるように設計されています。

  • Perl

    461questions

    Perlは多目的に使用される実用性が高い動的プログラミング言語のひとつです。

  • 文字コード

    211questions

    文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

Perl MySQLにJSONを格納時に文字化けする

解決済

回答 4

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 3,280
退会済みユーザー

退会済みユーザー

環境

* Perl 5.8
* MySQL 
* 文字コード EUC-JP

Perlで、DBI経由でmediumtextのカラムにJSONを格納しようとしています。
しかし、文字化けが発生してしまいます。
 
print $ref->{'json'};
# 出力
# '{"備考":"ほげほげ"}'

if ($ref->{'json'} eq '{"備考":"ほげほげ"}') {
    print "同一である";
}
# 出力
#同一である

ここで、DBIに$ref->{'json'}を渡すと文字化けしてしまいます。
しかし、変数に格納せずに直接、'{"備考":"ほげほげ"}'を渡すと文字化けせずに挿入されます。

JSONを作成時には、JSON::to_jsonを使用しています。

ご存知のかた、よろしくお願い致します。
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 4

checkベストアンサー

+1

うーん、どうやら最近のDBIがちょっとおかしな(?)挙動をようです・・・?
ソースはEUC-JPで内部コードを使用していない環境を想定してサンプル書きます

use JSON;
my $target_str = to_json({"備考" => "ほげほげ"});

{
   use utf8;
   use DBI;
   use Encode;

   my $dbh = DBI->connect("dbi:SQLite:dbname=./test.sqlite");
   $dbh->do("create table if not exists testtest(json_str text)");
   $utf8flg = decode("euc-jp", $target_str);
   $dbh->do("insert into testtest(json_str) values(?)", undef, $utf8flg);
}

どうもDBIがutf8フラグのないマルチバイト文字をエスケープするか何かして文字化けさせるようです。
このように、スコープを作りutf8フラグがある環境を部分的に作り保存すると文字化けせず行けるのを確認しました。
最近のPerlでソースを書く時はutf8で内部コード使って書く方がトラブル少なくていいと思います。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2015/07/02 21:49

    すみません、スコープとか作らなくても内部コードへ変換するだけで動作しました

    use Encode;
    use DBI;
    use JSON;
    my $target_str = to_json({"備考" => "ほげほげ"});

    my $dbh = DBI->connect("dbi:SQLite:dbname=./test.sqlite");
    $dbh->do("create table if not exists testtest(json_str text)");
    $utf8flg = decode("euc-jp", $target_str);
    $dbh->do("insert into testtest(json_str) values(?)", undef, $utf8flg);

    キャンセル

+1

そもそも、JSONはUnicodeで記述することが前提となっています(ECMAによる規格書)。どうしてもEUCとしてハンドリングしたければ、手動で変換するしかないでしょう。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

maisumakunさんのおっしゃるようにJSONはUnicodeの文字列でなければなりません。
変数に格納せずに直接、'{"備考":"ほげほげ"}'を渡すと文字化けしないのは、ソース
ファイルがUnicode(UTF-8)で記述されているからではないでしょうか?

JSON::to_json
ではなくて
JSON::encode_json
でJSONを作成してみてはいかがでしょうか?
それで作成すると文字コードも変換するようです。

参考
http://d.hatena.ne.jp/punitan/20100410/1270927420

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

こちらで解決致しました。
Perlの内部文字コードの理解が浅く、ハマってしまいました。

encode('euc-jp', decode('euc-jp', to_json({"備考" => "ほげほげ"})));

今回は、EUC-JPでJSONを扱いたかったので、EUC-JPで作ることにします。

回答頂きました皆様、ありがとうございました!

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

関連した質問

同じタグがついた質問を見る

  • MySQL

    6034questions

    MySQL(マイエスキューエル)は、TCX DataKonsultAB社などが開発するRDBMS(リレーショナルデータベースの管理システム)です。世界で最も人気の高いシステムで、オープンソースで開発されています。MySQLデータベースサーバは、高速性と信頼性があり、Linux、UNIX、Windowsなどの複数のプラットフォームで動作することができます。

  • JSON

    1206questions

    JSON(JavaScript Object Notation)は軽量なデータ記述言語の1つである。構文はJavaScriptをベースとしていますが、JavaScriptに限定されたものではなく、様々なソフトウェアやプログラミング言語間におけるデータの受け渡しが行えるように設計されています。

  • Perl

    461questions

    Perlは多目的に使用される実用性が高い動的プログラミング言語のひとつです。

  • 文字コード

    211questions

    文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。