前提・実現したいこと
Python3.7.6を使用しています。
早速ですが、
次のようなHTMLから、URL部分
「http://www.test.co.jp/about.html」
のところを抜き出したいです。
HTML
1<a class="test_class_name" href="http://www.test.co.jp/about.html"> 2 プロフィール紹介ページ 3</a>
試したこと
次のように書いてみましたが、「プロフィール紹介ページ」という本文のほうが取得されてしまいます。(当たり前か…)
Python
1import requests 2import bs4 3 4data = requests.get("http://www.test.co.jp/article1.html") 5soup = bs4.BeautifulSoup(data.text, "html.parser") 6elems = soup.find_all(class_='test_class_name') 7 8for x in elems: 9 print(elems)
当方Python初心者で、いくつかのサイトをあたってみたのですが同様のことをしている先人が見つかりませんでしたので、質問させていただきました。
よろしくお願いします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/06/23 07:29
2020/06/23 07:33