日本語の文章で、カッコ内の文章をカッコごと削除したい

前提・実現したいこと

pythonで言語解析を行うための前処理を行なっています。
具体的にはカッコ内の部分を取り除きたいのですが、日本語の処理がうまくいきません
入力:やあ。(立ち上がる)調子はどうだい？(聡子、振り返る)
期待する出力:やあ。調子はどうだい？

該当のソースコード

python
1import re 
2text = "やあ。(立ち上がる)調子はどうだい？(聡子、振り返る)"
3# print(re.sub("\（[ぁ-ん ァ-ン 一-龥]+?)", "", text)) 動かない
4print(re.sub("\（(.+?))", "", text))
5match = re.search(r"((.*?))",text)
6print(match.groups(0))
7

出力結果

やあ。(立ち上がる)調子はどうだい？(聡子、振り返る)
('立ち上がる',)

試したこと

英文の場合はsubでうまくいきます。
また、searchの場合は一つ目しか出力されません。
参考サイト
https://docs.python.org/ja/3/library/re.html
https://www.delftstack.com/ja/howto/python/remove-certain-characters-from-string-python/

補足情報（FW/ツールのバージョンなど）

colabで使用しています。

行動規範の内容に同意します

回答1件

ベストアンサー

以下です。と書きましたが慌てて書いて間違っていました。[^(]*でなく、[^)]*でした。

python
1>>> import re
2>>> text = "やあ。(立ち上がる)調子はどうだい？(聡子、振り返る)"
3>>> print(re.sub(r'([^)]*)', '', text))
4やあ。調子はどうだい？

[^(]*の部分でカッコの中身の文字をどのように指定しているのでしょうか？
よろしければご回答お願いします。
^(はカッコで始まる、*は0回以上の繰り返しということは理解しています。

修正版で、'[^)]*'の意味は、'[^)]'は')'ではない文字一文字です。それが0回以上なので、')'ではない文字0回以上という意味になります。

投稿2021/09/30 23:39

編集2021/10/01 03:28

ppaul

総合スコア24672

ChN

2021/09/30 23:48

ありがとうございます。素人で申し訳ないのですが、[^(]*の部分でカッコの中身の文字をどのように指定しているのでしょうか？よろしければご回答お願いします。 ^(はカッコで始まる、*は0回以上の繰り返しということは理解しています。

ChN

2021/10/01 00:02

すみません、600文字程度の環境だと動作しませんでした...

ppaul

2021/10/01 03:29 編集

回答に書いた正規表現が間違っていました。修正版で試してみてください。

ChN

2021/10/01 04:32

ありがとうございます！うまくいきました。 (本番では半角カッコと全角カッコが混ざっていたのも原因でした。）

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.29%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

前提・実現したいこと

該当のソースコード

試したこと

補足情報（FW/ツールのバージョンなど）

関連した質問