前提・実現したいこと
text
1\u7947ee\u5712\u7cbe\u820e\u306e
上記のような文字列から、findallを使って、
python
1['\u7947', 'e', 'e', '\u5712', '\u7cbe', '\u820e', '\u306e']
このようにマッチした文字を取り出したいです。
発生している問題・エラーメッセージ
python
1 exp = "\u\w{4}|\w" 2 matchArray = re.findall(exp, マッチングしたい文字列)
このようにしたところ、
python
1['u7947', 'u5712', 'u7cbe', 'u820e']
このような形で返ってきてしまいました。
"\u7947" の形で返してほしいのですが、どうにも上手く指定できません。
試したこと
正規表現を "\u\w{4}|\w" のようにすると、
python
1['\u7947', '\u5712', '\u7cbe']
と返ってきました。
元の文字列は "\u7947" となっているのに、どうしてマッチングした結果はバックスラッシュが二つ付いてくるのでしょう?
かれこれ数時間詰まっているのですが、どうにも改善できません。
どなたかお知恵をお貸しいただけると幸いです。
補足情報
Python2系を使用しています。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。