質問編集履歴

誤字

2019/05/03 16:46

投稿

スコア21

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -1,35 +1,3 @@
-### 前提・実現したいこと
-スクレイピングによってweb上のテーブルタグから情報を抜き出し、CSVファイルを得たい。
-### 発生している問題・エラーメッセージ
-スクレイピングしたいページ
-https://traininfo.jreast.co.jp/delay_certificate/history.aspx?R=06
-ここから<table>で書かれた遅延情報を抜き出したいが、ヘッダーの次の日付までは<tr> </tr>で行が形成されているが、次の行から、終了タグ</tr>だけで区切られており、Beautifulsoup4のfind_all('tr')でタグを回収できない。
-この場合、この形式のテーブルからどうCSVファイルを抜き出すのかがわからない。
-### 該当のソースコード
-```python3.7
-ソースコード
-```
 ### 前提・実現したいこと
 スクレイピングによってweb上のテーブルタグから情報を抜き出し、CSVファイルを得たい。
@@ -68,16 +36,12 @@
-# URLの指定
 html = urlopen("https://traininfo.jreast.co.jp/delay_certificate/history.aspx?R=06")
 bsobj = BeautifulSoup(html, "lxml")
-# テーブルを指定
 table = bsobj.find_all("table")
 rows = table[0].find_all("tr")