質問編集履歴
2
修正
title
CHANGED
File without changes
|
body
CHANGED
@@ -1,21 +1,8 @@
|
|
1
1
|
Pythonで文字列の中に含まれるUnicodeエスケープされたバイト列を部分的に文字列に変換する方法をご教示いただきたいです。
|
2
2
|
|
3
|
-
```Python
|
4
|
-
# AsIs
|
5
|
-
|
3
|
+
具体的には、`挨拶 == "\u3053\u3093\u306b\u3061\u306f`というような形式の文字列をスクレイピングで取得するのですが、
|
6
|
-
|
4
|
+
この文字列をPandasのDataFrameに挿入すると、エスケープされたバイト列がそのまま表示されてしまいます。
|
7
5
|
|
8
|
-
|
6
|
+
最終的には `'挨拶 == "こんにちは"'` というように、文字列に含まれたバイト列が部分的にデコードされた状態で、DataFrameに挿入したいです。
|
9
7
|
|
10
|
-
```Python
|
11
|
-
# ToBe
|
12
|
-
'挨拶 == "こんにちは"'
|
13
|
-
```
|
14
|
-
|
15
|
-
下記のやり方では当初のバイト列は正しく変換されますが、「挨拶」の方が文字化けしてしまいます。
|
16
|
-
```Python
|
17
|
-
bytes(s, encoding='utf-8').decode('unicode-escape')
|
18
|
-
```
|
19
|
-
|
20
|
-
汎用的なやり方があればご教示いただきたいですが、難しければ「ダブルクオートに囲まれている」という条件に一致するものを変換するというやり方でも問題ないです。
|
21
8
|
ご回答のほどよろしくお願いいたします。
|
1
タイトル変更
title
CHANGED
@@ -1,1 +1,1 @@
|
|
1
|
-
Python|Unicodeエスケープされたバイト列を部分的に
|
1
|
+
Python|文字列に含まれるUnicodeエスケープされたバイト列を部分的に変換する方法
|
body
CHANGED
File without changes
|