現在pythonでwebスクレイピングを行っています。
URLリスとを作成するところまでは実現できたのですが、リスト内のURLには関係ないURLも含まれております。
そこで"https://****/Forum/ja/"を含むURLのみを抽出したいと考え実装を行っておりますが、実現できません。
どの様にすればよろしいでしょうか?お力添えよろしくお願いいたします。
python
1from bs4 import BeautifulSoup 2import requests 3 4# アクセスするURL 5url = "https://****/Forum/ja/home" 6 7# htmlを取得、BeautifulSoupで扱う 8 9r = requests.get(url) 10soup = BeautifulSoup(r.content, 'html.parser') # BeautifulSoupの初期化 11 12tags = soup.find_all("a") 13for tag in tags: 14 print(tag.get("href"))
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。