質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.32%

  • Java

    14433questions

    Javaは、1995年にサン・マイクロシステムズが開発したプログラミング言語です。表記法はC言語に似ていますが、既存のプログラミング言語の短所を踏まえていちから設計されており、最初からオブジェクト指向性を備えてデザインされています。セキュリティ面が強力であることや、ネットワーク環境での利用に向いていることが特徴です。Javaで作られたソフトウェアは基本的にいかなるプラットフォームでも作動します。

  • Android

    6737questions

    Androidは、Google社が開発したスマートフォンやタブレットなど携帯端末向けのプラットフォームです。 カーネル・ミドルウェア・ユーザーインターフェイス・ウェブブラウザ・電話帳などのアプリケーションやソフトウェアをひとつにまとめて構成。 カーネル・ライブラリ・ランタイムはほとんどがC言語/C++、アプリケーションなどはJavaSEのサブセットとAndroid環境で書かれています。

Android 文字列UTF変換について

解決済

回答 2

投稿

  • 評価
  • クリップ 0
  • VIEW 155

kazzzstudio

score 86

サーバーからJSONで送られてきた文字列をAndroidで表示する処理を作っているのですが、正しく表示できません。

String _tmp_string = data.getString("name");
String _tmp_string_2 = "";

for (int j = 0; j <= _tmp_string.length() - 5; j=j+5) {
    _tmp_string_2 += "\\" + _tmp_string.substring(j, j+5);
}

Log.d("MyProj", "_tmp_string_2 = " + _tmp_string_2);
byte[] _byte_name = _tmp_string_2.getBytes("UTF-8");
Log.d("MyProj", "_byte_name = " + _byte_name);

// byte[] _byte_name = "\u4ec1\u53cb\u4f1a".getBytes("UTF-8");

// Log.d("MyProj", "_byte_name = " + _byte_name);

String _tmp_name = new String(_byte_name, "UTF-8");
Log.d("MyProj", "_tmp_name = " + _tmp_name);

PaymentList item = new PaymentList(bmp, _tmp_date, _tmp_name, data.getString("price") + "円");
listItems.add(item);

表示結果は、\u4ec1\u53cb\u4f1aとなってしまいます。

今コメントにしている、

byte[] _byte_name = "\u4ec1\u53cb\u4f1a".getBytes("UTF-8");


に置き換えると正しく日本語が表示できている状態です。

_tmp_string_2 = \u4ec1\u53cb\u4f1a


と変換できているので何が原因なのかわかりません。

どこが間違っているのかご指摘いただけると幸いです。
よろしくお願いします。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • kazzzstudio

    2018/05/26 14:45

    _tmp_stringを表示すると、u4ec1u53cbu4f1aとなります。

    キャンセル

  • asahina1979

    2018/05/26 20:13

    2文字目の1バイト目からしてSJISかしら?

    キャンセル

  • kazzzstudio

    2018/05/26 20:21

    UTF-16で"4ec1"は仁、"53cb"は友、"4f1a"は会なので、UTF-16になっていると思います。同じjsonをiOS(Swift)ではなんの加工も必要なく正しく表示できています。

    キャンセル

回答 2

checkベストアンサー

+2

以下のメソッドでデコードできます。

static final Pattern UNICODE_ESCAPE = Pattern.compile("u([\\dA-Z]{4})", Pattern.CASE_INSENSITIVE);

static String decode(String s) {
    Matcher m = UNICODE_ESCAPE.matcher(s);
    StringBuffer sb = new StringBuffer();
    while (m.find())
        m.appendReplacement(sb, Character.toString((char)Integer.parseInt(m.group(1), 16)));
    m.appendTail(sb);
    return sb.toString();
}

使い方は以下のとおりです。

String _tmp_string = "u4ec1u53cbu4f1a";
System.out.println(decode(_tmp_string));
// -> 仁友会

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/05/27 09:04

    ありがとうございます!できました!ただ、\をつけるのではダメなのですね。

    キャンセル

+2

 _tmp_string_2 += "\\" + _tmp_string.substring(j, j+5);

ここで既に違っていると思われます。
_tmp_string_2 に格納(+=)されている文字列が、(最初の場合)「\u4ec1」(6文字)です。javaで言うところの、"\u4ec1"(こちらは、UTF-16? で一文字)ではありません。
Jsonが送ってくる文字列が、"u4ec1"と言う文字列なので、それをUTF-16(で良かった?)の文字コードとして認識、一文字の変換する処理が必要です。変換方法は、、、即答できるほど、覚えていないので、後で調べてみたいと思います。
(どなたか、知っている方、よろしく。 泥臭い方法は分かるのですが)

[追記]
デコード方法の提示がありました。ありがとうございます。
なお、"\" の追加のみで NGの意味ですが、

"\\" + _tmp_string.substring(j, j+5);

は、ソース上で、"\\u4ec1" に相当します。上記に記載が漏れたので、追記します。
それに対し、ソースで、"\u4ec1" は、コンパイラが、一文字とみなし、変換します。(従って別物)

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/05/26 21:05

    ご回答、ありがとうございます。

    byte[] _byte_name = "\u4ec1\u53cb\u4f1a".getBytes("UTF-8");

    こちらのコードだとうまくいくので、同じ文字列を作ることができればうまくいくのではないかと思いました。そもそものアプローチが間違っているのでしょうか?

    キャンセル

  • 2018/05/27 09:28

    追記、ありがとうございます。わかりやすくまとめていただき、なにが良くなかったのか理解を深めることができました。

    キャンセル

同じタグがついた質問を見る

  • Java

    14433questions

    Javaは、1995年にサン・マイクロシステムズが開発したプログラミング言語です。表記法はC言語に似ていますが、既存のプログラミング言語の短所を踏まえていちから設計されており、最初からオブジェクト指向性を備えてデザインされています。セキュリティ面が強力であることや、ネットワーク環境での利用に向いていることが特徴です。Javaで作られたソフトウェアは基本的にいかなるプラットフォームでも作動します。

  • Android

    6737questions

    Androidは、Google社が開発したスマートフォンやタブレットなど携帯端末向けのプラットフォームです。 カーネル・ミドルウェア・ユーザーインターフェイス・ウェブブラウザ・電話帳などのアプリケーションやソフトウェアをひとつにまとめて構成。 カーネル・ライブラリ・ランタイムはほとんどがC言語/C++、アプリケーションなどはJavaSEのサブセットとAndroid環境で書かれています。