前提・実現したいこと
初めての質問なので拙かったり不足している表現がありましたら、申し訳ございません。
JRの遅延情報のページ
https://traininfo.jreast.co.jp/delay_certificate/history.aspx?R=06
のテーブルをスクレイピングしてcsvファイル化しようと2通りの方法で試したのですが
テーブルの頭の部分しかスクレイピングできないです。
発生している問題・エラーメッセージ
スクレイピングしても本日2019年4月30日から過去45日まで表示している遅延データが最初の4月29日、4月28日までしか取得できない。
該当のソースコード
python3.6(anacondaインストール済み、spyder上で検証)
11つ目 2import pandas as pd 3 4dfs=pd.read_html('https://traininfo.jreast.co.jp/delay_certificate/history.aspx?R=06') 5実行部 6dfs 7 82つ目 9from urllib.request import urlopen 10from bs4 import BeautifulSoup 11 12 13 14html = urlopen("https://traininfo.jreast.co.jp/delay_certificate/history.aspx?R=06") 15bsobj = BeautifulSoup(html, "html.parser") 16 17table = bsobj.find_all("table") 18 19実行部 20table
試したこと
補足情報(FW/ツールのバージョンなど)
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/05/03 11:33