下記のような文字列を日本語表記で表示したいです。
"¥Ç¥Õ¥©¥ë¥È¥°¥ë¡¼¥×"
実際に実行したコードは下記です。
encodingをutf-8に指定しているのに
文字化けしてしまいます。
元々gzipで圧縮されていて解凍の際に文字コードが変わっているようですが、これが原因でしょうか?
ファイルの文字コードは下記のようになってました。
$file -i test.gz
test.gz: application/x-gzip; charset=binary
$gzip -d test.gz
$file -i test
test: text/plain; charset=iso-8859-1
testファイル中身↓
aa, ¥Ç¥Õ¥©¥ë¥È¥°¥ë¡¼¥×,¥²¥¹¥È¥ë¡¼¥à,bb,cc
ruby
1File.open("test","r", encoding: "ISO-8859-1:utf-8") do |file| 2 file.each_line do |line| 3 row = line.scrub.split(",") 4 p row 5 end 6end 7#→出力結果 8["aa"," ¥Ç¥Õ¥©¥ë¥È¥°¥ë¡¼¥×,¥²¥¹¥È¥ë¡¼¥à","bb","cc"]
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/01/17 04:29 編集