前提・実現したいこと
pythonで言語解析を行うための前処理を行なっています。
具体的にはカッコ内の部分を取り除きたいのですが、日本語の処理がうまくいきません
入力:やあ。(立ち上がる)調子はどうだい?(聡子、振り返る)
期待する出力:やあ。調子はどうだい?
該当のソースコード
python
1import re 2text = "やあ。(立ち上がる)調子はどうだい?(聡子、振り返る)" 3# print(re.sub("\([ぁ-ん ァ-ン 一-龥]+?)", "", text)) 動かない 4print(re.sub("\((.+?))", "", text)) 5match = re.search(r"((.*?))",text) 6print(match.groups(0)) 7
出力結果
やあ。(立ち上がる)調子はどうだい?(聡子、振り返る) ('立ち上がる',)
試したこと
英文の場合はsubでうまくいきます。
また、searchの場合は一つ目しか出力されません。
参考サイト
https://docs.python.org/ja/3/library/re.html
https://www.delftstack.com/ja/howto/python/remove-certain-characters-from-string-python/
補足情報(FW/ツールのバージョンなど)
colabで使用しています。

回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/09/30 23:48
2021/10/01 00:02
2021/10/01 03:29 編集
2021/10/01 04:32