前提・実現したいこと
UTF8等の文字コードで作成されているCSVファイルを読み込んで
そのファイルをSJISに変換して出力したいです。
単に変換するだけではなく、変換前と変換後では
文字コード以外は同じ内容にする必要があります。
(例)UTF8で書かれた「あ」をSJISの「あ」にする。
発生している問題・エラーメッセージ
変換すると文字化けしてしまいます。
(例)
下記の3行はUTF8で書かれています。
"氏名","電話"
"髙橋","09011112222"
"鷗外","090-1111-2222"
これらをSJISに変換すると
?サソ"豌丞錐"
"髮サ隧ア"
"鬮呎ゥ?"
"09011112222"
"鮃怜、?"
"090-1111-2222"
となってしまいます。
該当のソースコード
package SWT;
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;
import java.io.PrintWriter;
import org.eclipse.swt.SWT;
import org.eclipse.swt.events.SelectionAdapter;
import org.eclipse.swt.events.SelectionEvent;
import org.eclipse.swt.widgets.Button;
import org.eclipse.swt.widgets.Display;
import org.eclipse.swt.widgets.Shell;
public class 文字コード変換 {
public static void main(String[] args) {
Display display = new Display();
Shell shell = new Shell(display);
shell.setText("実行");
shell.open();
Button but = new Button(shell,SWT.PUSH);
but.setText("実行");
but.setBounds(450,220,70,20);
but.addSelectionListener(new SelectionAdapter(){
public void widgetSelected(SelectionEvent e){
try {
/* 文字コードUTF-8のファイルを読み込んでShift-JISに変換する */
File fileIn = new File("C:\\Users\\Desktop\\java\\文字コード\\文字コードCSV\\UTF8.csv");
//文字コードUTF-8を指定してファイルを読み込む
FileInputStream input = new FileInputStream(fileIn);
InputStreamReader stream = new InputStreamReader(input, "UTF8");
BufferedReader buffer = new BufferedReader(stream);
//書き込む用のファイルを指定する
File fileOut = new File("C:\\Users\\Desktop\\「実行」機能保存先フォルダ\\変換後文字コード確認.csv");
PrintWriter p_writer = new PrintWriter
(new BufferedWriter(new OutputStreamWriter
(new FileOutputStream(fileOut),"SJIS")));
String str;
//ファイルの最終行まで読み込む
while((str = buffer.readLine()) != null){
byte[] b = str.getBytes();
//文字コードをShift-JISに変換する
str = new String(b, "SJIS");
String[] col = str.split(",", -1);
for ( int i=0; i<col.length; i++){
System.out.println(col[i]);
//ファイルに字列を書き込む
p_writer.println(col[i]);
}
}
//ファイルをクローズする
p_writer.close();
}
catch (IOException ex) {
ex.printStackTrace();
}
}
});
while (!shell.isDisposed()){
if (!display.readAndDispatch()){
display.sleep();
}
}
display.dispose();
}
}
試したこと
変換後の文字コードをUTF8にすると
文字化けせずに出力されます。
補足情報(FW/ツールのバージョンなど)
文字コードを取得する方法についても調べていますが
有力な情報を得られていません。
「815C」等の符号を取得する方法は分かりましたが
「UTF8」や「SJIS」といった文字コードを取得する方法が分からないです。
-
気になる質問をクリップする
クリップした質問は、後からいつでもマイページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
クリップを取り消します
-
良い質問の評価を上げる
以下のような質問は評価を上げましょう
- 質問内容が明確
- 自分も答えを知りたい
- 質問者以外のユーザにも役立つ
評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。
質問の評価を上げたことを取り消します
-
評価を下げられる数の上限に達しました
評価を下げることができません
- 1日5回まで評価を下げられます
- 1日に1ユーザに対して2回まで評価を下げられます
質問の評価を下げる
teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。
- プログラミングに関係のない質問
- やってほしいことだけを記載した丸投げの質問
- 問題・課題が含まれていない質問
- 意図的に内容が抹消された質問
- 過去に投稿した質問と同じ内容の質問
- 広告と受け取られるような投稿
評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。
質問の評価を下げたことを取り消します
この機能は開放されていません
評価を下げる条件を満たしてません
質問の評価を下げる機能の利用条件
この機能を利用するためには、以下の事項を行う必要があります。
- 質問回答など一定の行動
-
メールアドレスの認証
メールアドレスの認証
-
質問評価に関するヘルプページの閲覧
質問評価に関するヘルプページの閲覧
checkベストアンサー
0
ご提示いただいたコードの文字変換部だけ試しましたが、問題なく変換されていました。
出力先のコンソール等がUTF-8の設定になっているのではないですか?
投稿
-
回答の評価を上げる
以下のような回答は評価を上げましょう
- 正しい回答
- わかりやすい回答
- ためになる回答
評価が高い回答ほどページの上位に表示されます。
-
回答の評価を下げる
下記のような回答は推奨されていません。
- 間違っている回答
- 質問の回答になっていない投稿
- スパムや攻撃的な表現を用いた投稿
評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。
0
文字コードを取得する方法
ここでも何度か質問に上がっていたと思いますが、決定打はありません。
Unicodeについては、BOMがあれば、判定可能ですが、それ以外は、バイト列を見て、どのコードの可能性が高いかの判定しかありません。
市販ソフト(ツール)も同様で、誤判定もそこそこ。ただ、日本語の一般文書と範囲を限定すれば、そこそこの判定は可能と思います。(文字コード特有の癖を見る)
文字化けについては、 dice142さんの書かれたように出力時の問題と思います。
投稿
-
回答の評価を上げる
以下のような回答は評価を上げましょう
- 正しい回答
- わかりやすい回答
- ためになる回答
評価が高い回答ほどページの上位に表示されます。
-
回答の評価を下げる
下記のような回答は推奨されていません。
- 間違っている回答
- 質問の回答になっていない投稿
- スパムや攻撃的な表現を用いた投稿
評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。
15分調べてもわからないことは、teratailで質問しよう!
- ただいまの回答率 88.21%
- 質問をまとめることで、思考を整理して素早く解決
- テンプレート機能で、簡単に質問をまとめられる
2018/10/10 11:30
ご回答ありがとうございます。
出力したcsvファイルをエクセルの「外部データの取り込み」から
読み込みましたが、例で示したような文字化けが発生しました。
読み込んだ際、文字コードをUTF8にすると
一部の文字化けは解消しました。
2018/10/10 14:56