質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.49%

  • PostgreSQL

    1100questions

    PostgreSQLはオープンソースのオブジェクトリレーショナルデータベース管理システムです。 Oracle Databaseで使われるPL/SQLを参考に実装されたビルトイン言語で、Windows、 Mac、Linux、UNIX、MSなどいくつものプラットフォームに対応しています。

GB18030は一文字何バイトなのでしょうか?

解決済

回答 2

投稿

  • 評価
  • クリップ 0
  • VIEW 948

mo3

score 49




SQLで文字コードをコンバートする時、データに難漢字があるためGB18030を使っています。文字コードの事自体よく分かっていないのですが、GB18030を文字コードにした時日本語の全角1文字は何バイトになるのでしょうか?
また漢字が文字コードで対応してなくてコンバート出来ない時他に対処法があれば教えて下さい。

よろしくお願いします。
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • 退会済みユーザー

    退会済みユーザー

    2015/09/04 18:48 編集

    「GB 18030」も文字コード仕様の1つです。 「GB 18030 -> 別の文字コード」という変換を行っているということだと思うので、変換先の文字コードがなにかを書かれた方がよろしいかと思います。 --- [追加] ここは修正依頼を記入する欄なので、本文を修正した方がいいです。(そうでないと、普通ここは隠れていて誰の目にも止まりませんので)

    キャンセル

  • mo3

    2015/09/04 18:52

    すいません説明不足でした。UNICODE-> GB 18030 というふうにコンバートした結果、思うような結果が得られず文字のバイト数が分かればまだ対処のしようがあるかな…と思い質問させていただきました。

    キャンセル

回答 2

checkベストアンサー

0

2Byteか4byteでしょう。
http://charset.uic.jp/show/gb18030/
上の方が2Byte Code、下の方に4Byte Codeがあります。
A4A0 付近には、日本語のひらがながあります。日本語全部が入ってるかどうかは分かりません。
対応してない場合、「?」等を出すのが通常の処理ではないでしょうか。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2015/09/04 21:11

    中国の文字コードについて大枠の解説を見つけたので参考に貼っておきます。
    http://www.antenna.co.jp/ml/back/Chinese/gb_charset_memo.htm

    キャンセル

0

文字コードのことがよく分かっていないと言うことなので、念のために確認ですが、GB18030というのは中国の文字コードだと言うことを分かった上でのことでしょうか?
JIS規格の範囲内で扱えない文字がある場合は、ユニコードを使うのが普通です。

>また漢字が文字コードで対応してなくてコンバート出来ない時他に対処法があれば教えて下さい。 

「コンバート」ということは、紙の文字を見て入力するので無く、もともと何かの文字コードで表現されているわけですよね。であれば、元の文字コードが何であれ、ユニコードに変換できないことはまず無いと思います。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2015/09/05 01:38

    的確なご指摘だと思います。
    質問者の方の反応が無いので、なんとも言えませんが、例えば商品設計をする場合、政治的な理由でGB18030対応と謳わざるを得ない場面があります。つまり、中国に販路開拓するために、ユニコードを全面に押し出す訳にはいかないケースもあります。
    https://ja.wikipedia.org/wiki/Unicode
    (歴史)ご参照。
    ですので、私の回答は、あくまでGB18030上を前提としたものとしました。
    はい、過去に苦労した経験がございますw

    キャンセル

関連した質問

同じタグがついた質問を見る

  • PostgreSQL

    1100questions

    PostgreSQLはオープンソースのオブジェクトリレーショナルデータベース管理システムです。 Oracle Databaseで使われるPL/SQLを参考に実装されたビルトイン言語で、Windows、 Mac、Linux、UNIX、MSなどいくつものプラットフォームに対応しています。