質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

89.65%

文字コード変換

受付中

回答 2

投稿

  • 評価
  • クリップ 0
  • VIEW 3,005
退会済みユーザー

退会済みユーザー

hoge.txtの文字コードがASCIIになっています.
そのためか,ファイルを開くと
b'\xe3\x82\xa8\xe3\x82\xad\xe3\x82\xb5\xe3\x82\xa4\xe3\x83\x88'
b'\xe3\x83\x9b\xe3\x83\xbc\xe3\x83\xa0'
このようにコードで表示されるので困っています,
これをUTF-8等に変換しようと思い,nkfコマンドを実行したのですがうまくいきません.

S:>nkf -g hogee.txt
ASCII

S:>nkf -w --overwrite hogee.txt

S:>nkf -g hogee.txt
ASCII

どうしたらよいでしょう.
環境はwindows8.1です.

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 2

+1

Pythonをお使いなのですね!?

b'\xe3\x82\xa8\xe3\x82\xad\xe3\x82\xb5\xe3\x82\xa4\xe3\x83\x88'
b'\xe3\x83\x9b\xe3\x83\xbc\xe3\x83\xa0'


というのは、PythonのByte列が変換されないままファイル出力されてしまったものなので…Pythonを使えば簡単に元に戻せますよ。

たとえば、decode.py などの名前で下記コードを記載し、

# -*- coding: utf-8 -*-

import codecs

fin  = open('test.txt', 'r')
fout = open('mod_test.txt', 'w')

for line in fin:
        str = eval( line.decode('utf-8') )
        fout.write(str + '\n')

fin.close()
fout.close()


以下のように実行すればUTF-8に変換できますよ。

C:¥…> type test.txt
b'\xe3\x82\xa8\xe3\x82\xad\xe3\x82\xb5\xe3\x82\xa4\xe3\x83\x88'
b'\xe3\x83\x9b\xe3\x83\xbc\xe3\x83\xa0'


C:¥…>
C:¥…> python decode.py

C:¥…>
C:¥…> nkf32 -u mod_test.txt
エキサイト
ホーム

C:¥…>

ちなみに、蛇足ながらPythonで文字列を扱う際には、下記ページをご参考になさると良いと思います。

Python3で文字列を処理する際の心掛け

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

ファイルの内容が、文字通り、
b'\xe3\x82\xa8\xe3\x82\xad\xe3\x82\xb5\xe3\x82\xa4\xe3\x83\x88'
b'\xe3\x83\x9b\xe3\x83\xbc\xe3\x83\xa0' 
のようになっているのではないでしょうか。これは英数字記号の羅列なので文字コード変換してどうのこうのというレベルの問題では無いです。

何らかのプログラムで\xe3などを該当するバイトに置換する必要があります。
nkfが入っているようですが、他にどんなツールが使えますか?

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2015/12/22 21:31

    ご回答ありがとうございます。
    正直、ほとんど何も知らない状態で…

    他のツールと言いますとどのようなものを指すのでしょうか?

    キャンセル

  • 2015/12/22 22:06 編集

    > 他のツールと言いますとどのようなものを指すのでしょうか?
    プログラムが書けて実行できるような環境です。

    > 正直、ほとんど何も知らない状態で…
    であれば、自分でどうにかするのをあきらめて、ファイルの作成者に「読めない」旨を伝えて対処してもらうのがいいと思います。

    キャンセル

  • 2015/12/22 22:20

    プログラムにはPython3系を使用しています。
    ファイルは自分でいじっている最中にこのようになってしまいました。
    元々、utf-8だったのですが、何故か一部utf-8で読み込むことが出来ず試行錯誤していたところです。

    キャンセル

  • 2015/12/23 06:18 編集

    自分で書いたプログラムの出力と言うことであれば、プログラムを正しく修正するのがいいと思います。
    新規に質問を立てて、
    「こういうプログラムを書いた。結果はこうなることを期待したが、こうなってしまった。プログラムのどこが悪いのか?」と聞いて下さい。

    質問文の「ファイルを開くと」というのも具体的にどんなツール(メモ帳?、〇〇というエディタ?)での事なのかちゃんと書いてください。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 89.65%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる