前提・実現したいこと
スクレイピングによってweb上のテーブルタグから情報を抜き出し、CSVファイルを得たい。
発生している問題・エラーメッセージ
スクレイピングしたいページ
https://traininfo.jreast.co.jp/delay_certificate/history.aspx?R=06
ここから<table>で書かれた遅延情報を抜き出したいが、ヘッダーの次の日付までは<tr> </tr>で行が形成されているが、次の行から、終了タグ</tr>だけで区切られており、Beautifulsoup4のfind_all('tr')でタグを回収できない。
この場合、この形式のテーブルからどうCSVファイルを抜き出すのかがわからない。
該当のソースコード
python3.7
1ソースコード
from urllib.request import urlopen
from bs4 import BeautifulSoup
import csv
html = urlopen("https://traininfo.jreast.co.jp/delay_certificate/history.aspx?R=06")
bsobj = BeautifulSoup(html, "lxml")
table = bsobj.find_all("table")
rows = table[0].find_all("tr")
↑ここからどうCSVにすればいいかが不明
回答1件
あなたの回答
tips
プレビュー