質問するログイン新規登録

質問編集履歴

2

修正

2020/09/15 13:50

投稿

aaidehacktik
aaidehacktik

スコア7

title CHANGED
File without changes
body CHANGED
@@ -1,21 +1,8 @@
1
1
  Pythonで文字列の中に含まれるUnicodeエスケープされたバイト列を部分的に文字列に変換する方法をご教示いただきたいです。
2
2
 
3
- ```Python
4
- # AsIs
5
- s = '挨拶 == "\u3053\u3093\u306b\u3061\u306f"'
3
+ 具体的には、`挨拶 == "\u3053\u3093\u306b\u3061\u306f`というような形式の文字列をスクレイピングで取得するのですが、
6
- ```
4
+ この文字列をPandasのDataFrameに挿入すると、エスケープされたバイト列がそのまま表示されてしまいます。
7
5
 
8
- 上記のsという文字列下記のよう変換したいと考えています。
6
+ 最終的には `'挨拶 == "こんにちは"'` というように、文字列に含まれたバイト列が部分的にデコードされた状態でDataFrame挿入したいす。
9
7
 
10
- ```Python
11
- # ToBe
12
- '挨拶 == "こんにちは"'
13
- ```
14
-
15
- 下記のやり方では当初のバイト列は正しく変換されますが、「挨拶」の方が文字化けしてしまいます。
16
- ```Python
17
- bytes(s, encoding='utf-8').decode('unicode-escape')
18
- ```
19
-
20
- 汎用的なやり方があればご教示いただきたいですが、難しければ「ダブルクオートに囲まれている」という条件に一致するものを変換するというやり方でも問題ないです。
21
8
  ご回答のほどよろしくお願いいたします。

1

タイトル変更

2020/09/15 13:50

投稿

aaidehacktik
aaidehacktik

スコア7

title CHANGED
@@ -1,1 +1,1 @@
1
- Python|Unicodeエスケープされたバイト列を部分的に文字列に変換する方法
1
+ Python|文字列に含まれるUnicodeエスケープされたバイト列を部分的に変換する方法
body CHANGED
File without changes