質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

Q&A

解決済

1回答

6985閲覧

Python:バイトコードを含むJSON文字列を辞書オブジェクトに変換

kuma3

総合スコア60

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

0グッド

1クリップ

投稿2016/08/17 07:03

バイトコードを含むJSON文字列を辞書オブジェクトに変換したいです。

string_dic = '{"\\xe6\\xbc\\xa2\\xe5\\xad\\x97": 1}' # {"漢字":1}のバイトコード文字列 json.loads(string_dic) # エスケープエラー発生\xエスケープに対応していないもよう json.decoder.JSONDecodeError: Invalid \escape: line 1 column 3 (char 2)

Python:バイトコードを文字列に変換で純粋にバイトコード文字列で構成されている場合にバイトコード文字列を通常の文字列に変換する方法は分かりましたが、辞書オブジェクトを文字列に変換した場合に再度辞書オブジェクトに戻す良い方法が分かりません。

正規表現でバイトコード文字列部分を取得、その部分に対してバイトコードを文字列に変換するメソッドを適用して置き換え、置き換え後にjson.loads実行という方法があると思いますが他にもっと良い方法あればご教示いただきたく。
よろしくお願いします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

自己解決

正規表現を利用してバイトコード部分の文字列を修正する方法を記載しておきます。

def convert_byte_str(s): """バイト文字列を元の文字列に変換する""" return eval('b"{}"'.format(s)).decode() def convert_hbase_str(s): """\\xでエンコードされている文字列の部分を元の文字列に修正して返す""" p = re.compile(r'\\x[^"]+') return p.sub(lambda match: convert_byte_str(match.group(0)), s) escape_string_dic = '{"\\xe6\\xbc\\xa2\\xe5\\xad\\x97": 1}' modify_string_dic = convert_hbase_str(excape_string_dic) print(modify_string_dic) '{"漢字": 1}'

投稿2016/08/18 09:00

kuma3

総合スコア60

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問