質問編集履歴
2
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -2,40 +2,14 @@
|
|
2
2
|
|
3
3
|
|
4
4
|
|
5
|
-
``
|
5
|
+
具体的には、`挨拶 == "\u3053\u3093\u306b\u3061\u306f`というような形式の文字列をスクレイピングで取得するのですが、
|
6
6
|
|
7
|
-
# AsIs
|
8
|
-
|
9
|
-
s
|
7
|
+
この文字列をPandasのDataFrameに挿入すると、エスケープされたバイト列がそのまま表示されてしまいます。
|
10
|
-
|
11
|
-
```
|
12
8
|
|
13
9
|
|
14
10
|
|
15
|
-
|
11
|
+
最終的には `'挨拶 == "こんにちは"'` というように、文字列に含まれたバイト列が部分的にデコードされた状態で、DataFrameに挿入したいです。
|
16
12
|
|
17
13
|
|
18
14
|
|
19
|
-
```Python
|
20
|
-
|
21
|
-
# ToBe
|
22
|
-
|
23
|
-
'挨拶 == "こんにちは"'
|
24
|
-
|
25
|
-
```
|
26
|
-
|
27
|
-
|
28
|
-
|
29
|
-
下記のやり方では当初のバイト列は正しく変換されますが、「挨拶」の方が文字化けしてしまいます。
|
30
|
-
|
31
|
-
```Python
|
32
|
-
|
33
|
-
bytes(s, encoding='utf-8').decode('unicode-escape')
|
34
|
-
|
35
|
-
```
|
36
|
-
|
37
|
-
|
38
|
-
|
39
|
-
汎用的なやり方があればご教示いただきたいですが、難しければ「ダブルクオートに囲まれている」という条件に一致するものを変換するというやり方でも問題ないです。
|
40
|
-
|
41
15
|
ご回答のほどよろしくお願いいたします。
|
1
タイトル変更
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
Python|Unicodeエスケープされたバイト列を部分的に
|
1
|
+
Python|文字列に含まれるUnicodeエスケープされたバイト列を部分的に変換する方法
|
test
CHANGED
File without changes
|