質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Android

Androidは、Google社が開発したスマートフォンやタブレットなど携帯端末向けのプラットフォームです。 カーネル・ミドルウェア・ユーザーインターフェイス・ウェブブラウザ・電話帳などのアプリケーションやソフトウェアをひとつにまとめて構成。 カーネル・ライブラリ・ランタイムはほとんどがC言語/C++、アプリケーションなどはJavaSEのサブセットとAndroid環境で書かれています。

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

Q&A

3回答

3548閲覧

全ての文字コードに対応したhttp通信について教えてください。

mummuu

総合スコア8

Android

Androidは、Google社が開発したスマートフォンやタブレットなど携帯端末向けのプラットフォームです。 カーネル・ミドルウェア・ユーザーインターフェイス・ウェブブラウザ・電話帳などのアプリケーションやソフトウェアをひとつにまとめて構成。 カーネル・ライブラリ・ランタイムはほとんどがC言語/C++、アプリケーションなどはJavaSEのサブセットとAndroid環境で書かれています。

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

0グッド

0クリップ

投稿2015/10/10 17:00

プログラミング初心者です。
現在、Android studio (java)を利用してアプリケーションを作成しています。

HTTP通信をして、web上のテキストデータを取り出していますが、設定されている文字コードがまばらで取り出しに困っています。

BufferedReader br = new BufferedReader( new InputStreamReader(response.getEntity().getContent(),"文字コード" ));

このプログラムで、任意の文字コードは取り出せるようになりましたが設定以外のものは文字化けしてしまいます。
全ての文字コードに対応したhttp通信をするためには、どうしたらいいでしょうか。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

全ての文字コードに対応したhttp通信をするためには、どうしたらいいでしょうか。

結論から言えば、それは不可能です。

仮に、そこを「よしなに」機械的にできるのであれば、多くのプログラム言語において「fromからtoにコンバートする」関数で from も to も指定しなければいけない理由がありません。from は不要で、toだけあれば十分です。
PHPで言えば、mb_convert_encoding とか。(あまり良い例ではないけど…)

だからこそ、HTML の記述では文字コードを明示することが推奨されているわけですし、WEB上のドキュメントを取得する際には、<meta charset="UTF-8" /> などを取得して判定する以外に方法はないかと思います。

投稿2015/10/10 17:16

退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

response.getEntity().getContentEncoding()でレスポンスの文字コード取得できないでしょうか?

そのあと、上記メソッドで取得した文字コードから指定の文字コードに変換かければ
あまり文字化けることないかと思います。

投稿2015/10/10 17:12

COHENZ

総合スコア52

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

http通信(httpというプロトコル)は、通信されるデータの中身(それが文字列なのか、文字列だとしたらどんなコード体系でエンコードされているか)については全く関知しない(それはhttpを利用するアプリ側の責任)なので、「全ての文字コードに対応したhttp通信をする」という考え自体がちょっとズレていると思います。

それで、受信した文字列を適切に処理するために、どのようにエンコードされたデータなのかをアプリ側で調べなければならない訳ですが、

HTTP通信をして、web上のテキストデータを取り出しています

というのが具体的にどのような処理なのかが分からないので具体的には回答できません。

ただ、Kosuke_Shibuyaさんの回答にある通り、本来はデータを提供する側がエンコードの種類を明示するべきですし、利用者側は何らかの方法でそれを確認するのが筋です。

とはいえ、数あるWebサイトが全てエンコーディング方法を親切に明示してくれている訳はないので、利用側で「推測」することで対応している事例はあります。あくまでも推測ですので 100% 対応出来る訳ではないですが、少なくともエラーの発生をかなり減らせる可能性はあります。
それで、以下の解説をご参考になさってはいかがでしょうか。
Javaで文字コード簡易判定
文字コードを推測する

投稿2015/10/11 13:35

pi-chan

総合スコア5936

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問