質問編集履歴

2

修正

2020/09/15 13:50

投稿

aaidehacktik
aaidehacktik

スコア7

test CHANGED
File without changes
test CHANGED
@@ -2,40 +2,14 @@
2
2
 
3
3
 
4
4
 
5
- ```Python
5
+ 具体的には、`挨拶 == "\u3053\u3093\u306b\u3061\u306f`というような形式の文字列をスクレイピングで取得するのですが、
6
6
 
7
- # AsIs
8
-
9
- s = '挨拶 == "\u3053\u3093\u306b\u3061\u306f"'
7
+ この文字列をPandasのDataFrameに挿入すると、エスケープされたバイト列がそのまま表示されてしまいます。
10
-
11
- ```
12
8
 
13
9
 
14
10
 
15
- 上記のsという文字列下記のよう変換したいと考えています。
11
+ 最終的には `'挨拶 == "こんにちは"'` というように、文字列に含まれたバイト列が部分的にデコードされた状態でDataFrame挿入したいす。
16
12
 
17
13
 
18
14
 
19
- ```Python
20
-
21
- # ToBe
22
-
23
- '挨拶 == "こんにちは"'
24
-
25
- ```
26
-
27
-
28
-
29
- 下記のやり方では当初のバイト列は正しく変換されますが、「挨拶」の方が文字化けしてしまいます。
30
-
31
- ```Python
32
-
33
- bytes(s, encoding='utf-8').decode('unicode-escape')
34
-
35
- ```
36
-
37
-
38
-
39
- 汎用的なやり方があればご教示いただきたいですが、難しければ「ダブルクオートに囲まれている」という条件に一致するものを変換するというやり方でも問題ないです。
40
-
41
15
  ご回答のほどよろしくお願いいたします。

1

タイトル変更

2020/09/15 13:50

投稿

aaidehacktik
aaidehacktik

スコア7

test CHANGED
@@ -1 +1 @@
1
- Python|Unicodeエスケープされたバイト列を部分的に文字列に変換する方法
1
+ Python|文字列に含まれるUnicodeエスケープされたバイト列を部分的に変換する方法
test CHANGED
File without changes