スクレイピングで取得したhrefタグ要素から、URLのみを取得したいのですが
取得したデータから、URLが抽出できず、エラーが出てしまいます。
t_linkまでの過程で、データを取得できていることを確認したのですが
その後の抽出過程を追加したところ、エラーが出てしまいます。
シンプルなコードに縮小しましたが、調べてもどこが悪いのかがわかりません。
アドバイスをお願い致します。
import requests import bs4 url = 'https://finance.yahoo.co.jp/cm/message/1009984/a5bda5ua5ha5pa5sa5af/818' res = requests.get(url) soup = bs4.BeautifulSoup(res.text,'html.parser') t_link_class_name = '#cat-pass > ul > li:nth-child(2) > a' t_link = soup.select(t_link_class_name) t_url = t_link.get('href') print (t_url)
理想のデータ取得結果:
https://finance.yahoo.co.jp/cm/thread/1835700
エラー内容:
--------------------------------------------------------------------------- AttributeError Traceback (most recent call last) <ipython-input-23-7b2ceca55c57> in <module> 9 t_link_class_name = '#cat-pass > ul > li:nth-child(2) > a' 10 t_link = soup.select(t_link_class_name) ---> 11 t_url = t_link.get('href') 12 13 print (t_url) AttributeError: 'list' object has no attribute 'get'
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/02/26 04:11