質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.50%

  • Python 3.x

    6412questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

  • Windows 10

    945questions

    Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。

Python3を使ってweb上から持ってきたファイル(16進数)をSJISに変換したい。

解決済

回答 2

投稿

  • 評価
  • クリップ 0
  • VIEW 117

GTT

score 1

 前提・実現したいこと

Python3を使ってweb上から持ってきたファイル(16進数)をSJISで変換したい。
16進数ファイルを読み込む際に以下のような文字化け?が起こりました。

 発生している問題・エラーメッセージ

Bash上でcatコマンドで開いた場合

b'"\x8f\xd8\x96\xbe\x8b@\x8a\xd6\x93\x99\x8e\xed\x95\xca","\x8f\xd8\x96\xbe\x81i\x94F\x8f\xd8\x81j\x8e\xed\x95\xca"....(※ 長すぎるので割愛)

Python3上で以下のソースコードで開いた場合

'b\'"\\x8f\\xd8\\x96\\xbe\\x8b@\\x8a\\xd6\\x93\\x99\\x8e\\xed\\x95\\xca","\\x8f\\xd8\\x96\\xbe\\x81i\\x94F\\x8f\\xd8\\x81j\\x8e\\xed\\x95\\xca"....(※ 長すぎるので割愛)

 該当のソースコード

>>> f = open("binfile.log","r", encoding="utf-8")
>>> str = f.read()
>>> str
>>> str.decode("sjis")

 試したこと

encodingを変更したり、Python3で読み込んだ文字列を操作しようとしたが効果なし。
strの一文字一文字を確認したところ、

>>> str
'b\'"\\x8f\\xd8\\x96\\xbe\\x8b@\\x8a\\xd6\\x93\\x99\\x8e\\xed\\x95\\xca","\\x8f\\xd8\\x96\\xbe\\x81i\\x94F\\x8f\\xd8\\x81j\\x8e\\xed\\x95\\xca"....(※ 長すぎるので割愛)
>>> str[0]
'b'
>>> str[1]
"'"
>>> str[2]
'"'
>>> str[3]
'\\'
>>> str[4]
'x'
>>> str[5]
'8'
>>> str[6]
'f'
>>> str[7]
'\\'


といった風に、
str[0]とstr[1]の間の'\'が存在していない
str[3]は'\\'で一文字になっている

 補足情報(FW/ツールのバージョンなど)

環境
+ Python 3.5.2
+ WSL
補足が必要でしたら、ご教示ください。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • efcode

    2018/07/16 23:07

    「\x??」の??をバイト列に入れてdecodeしてあげればsjisの「'"証明機関等種別..」というような文字列は得られるはずですが、もう少しプログラミングのベースを理解してからでないと難しいと思います。

    キャンセル

回答 2

checkベストアンサー

+3

プログラミン入門したての人にはやや難しいかも。
そのファイルは、シフトJISの文字列をPythonでの文字列として表現したものです。
evalするのがいいでしょう(もっと適切な関数があるかも知れません)。

f = open("binfile.log","r", encoding="utf-8")
str = f.read()
str = eval(str)
print(str.decode("sjis"))

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/07/17 03:01

    大変勉強になりました。
    ご教示頂いたとおり、evalを使えばうまくいきました!!
    Pythonが面白く感じれました!
    エンジニアではありませんが、日々の業務で楽しく使っていきたいと思います。

    キャンセル

0

エスケープの\がそのまま表示されているだけで、文字列としてはちゃんと読み込めています。

元のデータは16進数ファイルというか、pythonのbytes型を文字列で表現したもので、ファイル自体は普通のテキストなのでしょう(文字コードまではわからないけど。utf-8を指定して読めてるなら、utf-8?)。

なんとかデコードできないか色々試してみて、けっきょくうまく行かなかったので(努力次第でできなくはないと思う。大変なだけで。気が向いたらもう少しやってみます)、otnさんの回答のようにevalするのが一番楽だと思います。

binfile.logを作るときにbytesをstrに変換する処理がどこで走ってるんだと思いますが、そこでちゃんとdecode("sjis")すれば最初から普通に書き込まれてお得です。可能ならそちらを検討してください。binfile.logそのものをネットから拾ってきてるなら、仕方ありませんが・・・

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.50%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る

  • Python 3.x

    6412questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

  • Windows 10

    945questions

    Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。