正規表現のワイルドカード？について質問です

素人質問で恐縮なのですが、正規表現について全く知識がないので、（調べたのですが記号が多くて混乱してしまいました。）質問させてください。

"/youtube/a-san/today"
"/youtube/b-san/today"
"/youtube/c-san/today"

のような三つのurlが組み込まれたウェブサイトがあるとします。規則的に

"/youtube/*/today"

といった構造になっていると思うのですが、これをBeautifulSoupを使って、正規表現で取り出す（コンパイル？）にはどうしたら良いですか？

elems = soup.find_all(href=re.compile("/youtube/*/today"))

では[]が出てきたと思います。
よろしくお願いします。

行動規範の内容に同意します

回答1件

ベストアンサー

下記でどうでしょうか？

python
1elems = soup.find_all(href=re.compile("/youtube/.*/today"))

【追記】

python
1for el in elems:
2    new_tag = soup.new_tag('link href="/youtube/unknown/today"')
3    el.replace_with(new_tag)

投稿2020/11/27 11:42

総合スコア10736

退会済みユーザー

2020/11/27 11:43

回答どうもありがとうございます。逆に "/youtube/a-san/today" "/youtube/b-san/today" "/youtube/c-san/today" の真ん中(a-san)の部分をunknownと一括で変更するにはどうしたらいいでしょうか

2020/11/27 11:53

それはhtmlとしてでしょうか？

退会済みユーザー

2020/11/27 12:24

丁寧な回答ありがとうございます！本当に助かりました！

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問