質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.21%

文字コードを変換してCSVファイルを出力したいのですが文字コードの変換がうまくできません。

解決済

回答 2

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 1,834

moomin_y

score 9

 前提・実現したいこと

UTF8等の文字コードで作成されているCSVファイルを読み込んで
そのファイルをSJISに変換して出力したいです。
単に変換するだけではなく、変換前と変換後では
文字コード以外は同じ内容にする必要があります。

(例)UTF8で書かれた「あ」をSJISの「あ」にする。

 発生している問題・エラーメッセージ

変換すると文字化けしてしまいます。
(例)
下記の3行はUTF8で書かれています。
"氏名","電話"
"髙橋","09011112222"
"鷗外","090-1111-2222"
これらをSJISに変換すると
?サソ"豌丞錐"
"髮サ隧ア"
"鬮呎ゥ?"
"09011112222"
"鮃怜、?"
"090-1111-2222"
となってしまいます。

 該当のソースコード

package SWT;

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;
import java.io.PrintWriter;

import org.eclipse.swt.SWT;
import org.eclipse.swt.events.SelectionAdapter;
import org.eclipse.swt.events.SelectionEvent;
import org.eclipse.swt.widgets.Button;
import org.eclipse.swt.widgets.Display;
import org.eclipse.swt.widgets.Shell;




public class 文字コード変換 {

    public static void main(String[] args) {
        Display display = new Display();
        Shell shell = new Shell(display);
        shell.setText("実行");
        shell.open();

        Button but = new Button(shell,SWT.PUSH);
        but.setText("実行");
        but.setBounds(450,220,70,20);

        but.addSelectionListener(new SelectionAdapter(){
            public void widgetSelected(SelectionEvent e){
                try {
                     /* 文字コードUTF-8のファイルを読み込んでShift-JISに変換する */

                         File fileIn = new File("C:\\Users\\Desktop\\java\\文字コード\\文字コードCSV\\UTF8.csv");

                            //文字コードUTF-8を指定してファイルを読み込む
                         FileInputStream input = new FileInputStream(fileIn);
                        InputStreamReader stream = new InputStreamReader(input, "UTF8");
                        BufferedReader buffer = new BufferedReader(stream);

                            //書き込む用のファイルを指定する
                        File fileOut = new File("C:\\Users\\Desktop\\「実行」機能保存先フォルダ\\変換後文字コード確認.csv");
                        PrintWriter p_writer = new PrintWriter
                                    (new BufferedWriter(new OutputStreamWriter
                                    (new FileOutputStream(fileOut),"SJIS")));

                        String str;

                            //ファイルの最終行まで読み込む
                        while((str = buffer.readLine()) != null){

                            byte[] b = str.getBytes();

                                //文字コードをShift-JISに変換する
                            str = new String(b, "SJIS");

                            String[] col = str.split(",", -1);

                            for ( int i=0; i<col.length; i++){
                                System.out.println(col[i]);
                                    //ファイルに字列を書き込む
                                p_writer.println(col[i]);
                            }
                        }
                            //ファイルをクローズする
                        p_writer.close();
                }
                catch (IOException ex) {
                    ex.printStackTrace();
                }
            }
        });

        while (!shell.isDisposed()){
          if (!display.readAndDispatch()){
            display.sleep();
          }
        }

        display.dispose();
    }
}

 試したこと

変換後の文字コードをUTF8にすると
文字化けせずに出力されます。

 補足情報(FW/ツールのバージョンなど)

文字コードを取得する方法についても調べていますが
有力な情報を得られていません。
「815C」等の符号を取得する方法は分かりましたが
「UTF8」や「SJIS」といった文字コードを取得する方法が分からないです。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 2

checkベストアンサー

0

ご提示いただいたコードの文字変換部だけ試しましたが、問題なく変換されていました。
出力先のコンソール等がUTF-8の設定になっているのではないですか?

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/10/10 11:30

    dice142様
    ご回答ありがとうございます。
    出力したcsvファイルをエクセルの「外部データの取り込み」から
    読み込みましたが、例で示したような文字化けが発生しました。
    読み込んだ際、文字コードをUTF8にすると
    一部の文字化けは解消しました。

    キャンセル

  • 2018/10/10 14:56

    「外部データの取り込み」で文字コードを「Shift-JIS」にしても文字化けが起きたということでしょうか?

    キャンセル

0

文字コードを取得する方法

ここでも何度か質問に上がっていたと思いますが、決定打はありません。
Unicodeについては、BOMがあれば、判定可能ですが、それ以外は、バイト列を見て、どのコードの可能性が高いかの判定しかありません。

市販ソフト(ツール)も同様で、誤判定もそこそこ。ただ、日本語の一般文書と範囲を限定すれば、そこそこの判定は可能と思います。(文字コード特有の癖を見る)

文字化けについては、 dice142さんの書かれたように出力時の問題と思います。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.21%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる
  • トップ
  • Javaに関する質問
  • 文字コードを変換してCSVファイルを出力したいのですが文字コードの変換がうまくできません。