netokeibaのレースページの開催情報をデータ化しようと考えています。
beautifulsoupを用いて、table内のspanで囲まれた文字やリンクを取得しようと思ったのですが、noneが帰ってきてしまいます。
同じようなタグやクラスの指定はいくつかのサイトで成功しており、どこに問題があるのかわからず悩んでいます。これをうまく抽出するにはどうすれば良いのでしょうか。
import requests import csv import os import pprint from urllib.request import urlopen from bs4 import BeautifulSoup def main() -> None: #トップページを取得 url = "https://race.netkeiba.com/top" html = urlopen(url) soup = BeautifulSoup(html,"lxml") print(soup.get("a")) table = soup.findAll("li",class_ ="RaceList_DataItem ") pprint.pprint(table) if __name__ == '__main__': main()
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/05/13 12:40