pythonの正規表現バックスラッシュがうまくいかない

text
1\u7947ee\u5712\u7cbe\u820e\u306e

上記のような文字列から、findallを使って、

python
1['\u7947', 'e', 'e', '\u5712', '\u7cbe', '\u820e', '\u306e']

このようにマッチした文字を取り出したいです。

python
1  exp = "\u\w{4}|\w"
2  matchArray = re.findall(exp, マッチングしたい文字列)

このようにしたところ、

python
1['u7947', 'u5712', 'u7cbe', 'u820e']

このような形で返ってきてしまいました。
"\u7947" の形で返してほしいのですが、どうにも上手く指定できません。

正規表現を "\u\w{4}|\w" のようにすると、

python
1['\u7947', '\u5712', '\u7cbe']

と返ってきました。
元の文字列は "\u7947" となっているのに、どうしてマッチングした結果はバックスラッシュが二つ付いてくるのでしょう？

かれこれ数時間詰まっているのですが、どうにも改善できません。
どなたかお知恵をお貸しいただけると幸いです。

Python2系を使用しています。

行動規範の内容に同意します

回答1件

ベストアンサー

対話的インタプリタの出力は勝手にエスケープを足します。

python
1>>> s = "\hoge"
2>>> s
3'\hoge'
4>>> print(s)
5\hoge

なのですでに上手く行っています。

投稿2018/03/27 14:34

総合スコア30933

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問