質問編集履歴

修正

2020/09/15 13:50

投稿

スコア7

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,21 +1,8 @@
 Pythonで文字列の中に含まれるUnicodeエスケープされたバイト列を部分的に文字列に変換する方法をご教示いただきたいです。
-```Python
-# AsIs
-s = '挨拶 == "\u3053\u3093\u306b\u3061\u306f"'
+具体的には、`挨拶 == "\u3053\u3093\u306b\u3061\u306f`というような形式の文字列をスクレイピングで取得するのですが、
-```
+この文字列をPandasのDataFrameに挿入すると、エスケープされたバイト列がそのまま表示されてしまいます。
-上記のsという文字列を、下記のように変換したいと考えています。
+最終的には `'挨拶 == "こんにちは"'` というように、文字列に含まれたバイト列が部分的にデコードされた状態で、DataFrameに挿入したいです。
-```Python
-# ToBe
-'挨拶 == "こんにちは"'
-```
-下記のやり方では当初のバイト列は正しく変換されますが、「挨拶」の方が文字化けしてしまいます。
-```Python
-bytes(s, encoding='utf-8').decode('unicode-escape')
-```
-汎用的なやり方があればご教示いただきたいですが、難しければ「ダブルクオートに囲まれている」という条件に一致するものを変換するというやり方でも問題ないです。
 ご回答のほどよろしくお願いいたします。

タイトル変更

2020/09/15 13:50

投稿

スコア7

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- Python｜Unicodeエスケープされたバイト列を部分的に~~文字列に~~変換する方法
1	+ Python｜文字列に含まれるUnicodeエスケープされたバイト列を部分的に変換する方法

body CHANGED Viewed

File without changes