pythonでコードのURLから値 (文字列やランキング)を取得したいです。
get処理を行ってhtmlを取得した後、xpathを指定して値を取り出したいのですが
何故か値に何も入らない状態です。
xpathはfirefoxの管理ツールで取ってこれることを確認した上で指定している為、
間違っていません。
複数のサイトを参考にしているのですが、どれも方法が微妙に異なっており、現在、どれが主流の方法かわかりません。
お手数ですが、以下教えていただけると幸いです。
・getでhtmlを取得した際のxpathの指定方法
・xpathは合っているのにも関わらず、値が取り出せていない理由
python
1from importlib.metadata import requires 2import requests 3from urllib import request 4from lxml import html 5from bs4 import BeautifulSoup 6 7url = 'https://jp.global.nba.com/standings/' 8 9data = requests.get(url) 10text_html = data.text 11 12#HTMLをHtmlElementオブジェクトに設定 13root = html.fromstring(str(text_html)) 14 15a = root.xpath('//span[text()="2021-2022 レギュラーシーズン"]') 16print(a)
参考サイト
Requests+lxmlでXPathを使ってみたい
HTMLのスクレイピング:lxmlを使う
【Python入門】XPathでスクレイピングする手順をわかりやすく解説!
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。