例えば,文字列"https://www.hoge.com/hogehogemogemoge"の中からhttps://www.hoge.com/hogehogeを抜き出す方法はあるでしょうか?
ここで,mogemogeはURLの1部ではありません.
以下のような正規表現で抜き出すと
python
1pattern = "https?://[\w/:%#$&?()~.=+\-]+" 2````https://www.hoge.com/hogehogemogemoge`が抜き出されるはずです. 3このように抜き出されたくないものまで抜き出されます. 4どうしたら良いでしょうか?