質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
87.20%
PostgreSQL

PostgreSQLはオープンソースのオブジェクトリレーショナルデータベース管理システムです。 Oracle Databaseで使われるPL/SQLを参考に実装されたビルトイン言語で、Windows、 Mac、Linux、UNIX、MSなどいくつものプラットフォームに対応しています。

Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

データベース

データベースとは、データの集合体を指します。また、そのデータの集合体の共用を可能にするシステムの意味を含めます

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

解決済

PostgerSQLで作成したDBにCSVデータを登録したいのですがエラーとなり対応に苦慮しています。

S.Holy
S.Holy

総合スコア1

PostgreSQL

PostgreSQLはオープンソースのオブジェクトリレーショナルデータベース管理システムです。 Oracle Databaseで使われるPL/SQLを参考に実装されたビルトイン言語で、Windows、 Mac、Linux、UNIX、MSなどいくつものプラットフォームに対応しています。

Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

データベース

データベースとは、データの集合体を指します。また、そのデータの集合体の共用を可能にするシステムの意味を含めます

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

2回答

0評価

1クリップ

421閲覧

投稿2022/01/10 02:58

前提・実現したいこと

データファイルをAWKでCSVファイルに変換し、DBに登録したいです。

サーバ上に置いたデータをawkで区切り文字を付けてLinuxコマンド(>A111.csv >>A111.csv)を使用して、CSVファイルを作成しています。
また、そのCSVファイルを、PostgerSQLで作成したDBに対して
Psql COPY db_dddd from /a/a/A111.csv' encoding 'SJIS' WITH CSV;
と記載して実行したところ、以下のメッセージが発生しました。

発生している問題・エラーメッセージ

invalid byte swquence for encoding "SJIS":0X81 0X2C

とのエラーが出て登録できません。
記載方法が違うのでしょうか?
それとも記載が足りないのでしょうか?
なお、CSVファイルのデータ内容には日本語項目が含まれています。

ネットで調べてみましたが、「 encoding "UTF8"」というのは色々出てきますが、
SJISについては少ないので質問させていただきます。

試したこと

Psql COPY db_dddd from /a/a/A111.csv' WITH CSV;
で実行してみましたが結果は変わりませんでした。

補足情報(FW/ツールのバージョンなど)

PostgerSqLデータベースの文字コードの確認は
SELECT character_set_name FROM information_schema.character_sets;
character_set_name

UTF8

と出力されました。

良い質問の評価を上げる

以下のような質問は評価を上げましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

  • プログラミングに関係のない質問
  • やってほしいことだけを記載した丸投げの質問
  • 問題・課題が含まれていない質問
  • 意図的に内容が抹消された質問
  • 過去に投稿した質問と同じ内容の質問
  • 広告と受け取られるような投稿

評価を下げると、トップページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

YT0014

2022/01/10 05:02

エラーメッセージをきちんと読みましょう。 「SJISエンコードでは無効なバイト列:0X81 0X2C」となっており、812cというコードが、SJISには存在しない、というエラーです。 SJISの文字コード表も確認しましたが、該当する文字がありません。 対象のCSVファイルを確認して、812Cの文字を特定してください。 また、エディタなどで、SJISとして読込んでみて、正常に読込めるか、ご確認ください。
YT0014

2022/01/10 13:02

0x2Cは、カンマの文字コードなので、awkでの処理に誤りがあり、2バイト文字の間にカンマが入り込んでいる状態だと思われます。

まだ回答がついていません

会員登録して回答してみよう

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
87.20%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

PostgreSQL

PostgreSQLはオープンソースのオブジェクトリレーショナルデータベース管理システムです。 Oracle Databaseで使われるPL/SQLを参考に実装されたビルトイン言語で、Windows、 Mac、Linux、UNIX、MSなどいくつものプラットフォームに対応しています。

Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

データベース

データベースとは、データの集合体を指します。また、そのデータの集合体の共用を可能にするシステムの意味を含めます

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。