前提・実現したいこと
pythonの正規表現でunicodeを削除したいです
'あいうえお\ud83c\udf38かきくけこ\u3000さしすせそ'
↓
'あいうえおかきくけこさしすせそ'
というようにしたいです
発生している問題・エラーメッセージ
SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 56-59: truncated \uXXXX escape
該当のソースコード
python
1text = 'あいうえお\ud83c\udf38かきくけこ\u3000さしすせそ' 2pattern = r'\u[a-zA-Z0-9_]{4}' 3# pattern = '\u3000' 4text = re.sub(pattern,'',text) 5print(text)
試したこと
おそらくバックスラッシュ周りのエラーだと思ったので、試行錯誤したのですがうまく動きませんでした。。。
補足情報(FW/ツールのバージョンなど)
ここにより詳細な情報を記載してください。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/08/22 08:00