質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

88.10%

pgadmin3/4でUTF8でクエリをかけてしまうのをどうにかしたい

解決済

回答 2

投稿

  • 評価
  • クリップ 0
  • VIEW 7,765

score 12

前提・実現したいこと

PostgreSQL9.6.1にEUC_JPのDBを作成したものをpgadminで接続し、テーブルを直接編集したいです。

pgadminIII、またはpgadmin4にて、
■pgadminIII時
「データベース」→任意のデータベース→スキーマ→「public」→「テーブル」→任意のテーブルを選択→ウインドウ上メニューの「選択オブジェクトデーデータをビュー」ボタンを押下。

■pgadmin4時
DB選択→Schemas→public→Tables→任意のテーブル右クリック「View Data」→「View All Rows」を選択。

どちらのケースでも白紙となり、pgadminIIIでは「アボート」と左下に表示されます。

発生している問題・エラーメッセージ

PostgreSQLサーバーでは以下のメッセージとなります。

< 2017-01-24 12:54:08.287 JST > ERROR:  符号化方式"EUC_JP"における0xf9 0xf5バイトシーケンスを持つ文字は"UTF8"符号化方式で は等しくありません
< 2017-01-24 12:54:08.287 JST > ステートメント:  SELECT * FROM public.order
        ORDER BY order_id
        ASC


このことから、UTF8でクエリを行っていることがマズイのですが、これをEUC_JPでクエリさせる方法が解りません。

試したこと

ローカルPCの環境変数に「PGCLIENTENCODING」を作成し、値に「EUC_JP」を設定しましたが、結果は同じでした。

補足情報(言語/FW/ツール等のバージョンなど)

クライアントOSはWindows10 Pro 64bitです。
PostgreSQLサーバーに対し、postgresql.confに
client_encoding = EUC_JP
を設定して再起動しましたが、結果は同じでした。
どうも、pgadminが強制的にUTF8で見に行っているようです。
コマンドプロンプトで
C:\>cd "c:\Program Files (x86)\pgAdmin III\1.12"
c:\Program Files (x86)\pgAdmin III\1.12>psql -U postgres -p hoge -hexample.com testdb
psql (9.0.0, server 9.6.1)
WARNING: psql version 9.0, server version 9.6.
Some psql features might not work.
Type "help" for help.

testdb=# \encoding
EUC_JP
testdb=# SELECT * FROM public.order
testdb-#         ORDER BY order_id
testdb-#         ASC;
order_id ..snip...
と正常に出力されます。
また、100件までのクエリでは正常に結果が返る事から、テーブル内でEUCコードとUTF8と相容れない文字があるのだと推測しますが、解決法が解りません。
どなたか、解決法は解りますでしょうか。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 2

checkベストアンサー

+2

問題になっている0xf9f5は、「﨑」という文字で、これはMicrosoftなどによる独自拡張の文字です。

しかもややこしいことに、この「﨑」は「NEC選定IBM拡張文字」と「IBM拡張文字」として、文字コード上に二重に入っているため、EUC⇔Unicodeの変換テーブルから外されてしまっている、ということのようです(参照)。

クエリもEUCで投げ続けるか、テーブルごとUTF-8に変えて運用するかの2つに1つだと思います。

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/01/24 14:24

    こんな罠があるんですね…。
    ```
    nkf -e data.sql > data2.sql
    ```
    したらデータサイズが変わったので、恐らくこの問題でしょうね。
    ありがとうございます!

    キャンセル

+1

同じことだと思いますが、以下のクエリを発行しても駄目でしょうか。
set client_encoding to 'EUC_JP';

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/01/24 14:24

    それはやってみました…。が、ダメでした。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 88.10%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る