質問編集履歴

誤字

2019/05/09 17:12

投稿

pythonista

スコア21

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,4 +1,4 @@
-##![イメージ説明](b791bd3ab4fb8ac3f99e88842d5a8466.png)現したいこと
+##実現したいこと
 　JR東日本の中央本線の遅延情報をスクレイピングしたい。
 遅延情報はhtmlの<table>属性で書かれているため、それをスクレイピングしてCSVファイルにしたいが、タグが破損しているため、Pandasのhtml_read()を使えず、BeautifulSoup4でCSVファイル化しようにも、テーブルの要素をすべて取得できないためかなわず。
 そこで、自力でhtmlファイルを修復するプログラムを考えている。

画像の追加

2019/05/09 17:12

投稿

pythonista

スコア21

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,4 +1,4 @@
-### 前提・実現したいこと
+##![イメージ説明](b791bd3ab4fb8ac3f99e88842d5a8466.png)現したいこと
 　JR東日本の中央本線の遅延情報をスクレイピングしたい。
 遅延情報はhtmlの<table>属性で書かれているため、それをスクレイピングしてCSVファイルにしたいが、タグが破損しているため、Pandasのhtml_read()を使えず、BeautifulSoup4でCSVファイル化しようにも、テーブルの要素をすべて取得できないためかなわず。
 そこで、自力でhtmlファイルを修復するプログラムを考えている。
@@ -9,6 +9,10 @@
 そのために、</tr>が文字列中に何回登場するかを計算した。
 JR東日本は過去４５日分の遅延情報を載せているが、プログラムコード結果は２回であった。
 どこがおかしいのか、また、このような原因を自力で発掘するアイデア等があればぜひ教えていただきたいです。初心者の質問であるため、不勉強や説明不足等があれば申し訳ありません。
+![イメージ説明](c2956e864701ad6f43cee6bd067c14af.png)
+５月１日のデータです。
+</tr>のタグのみで、開始タグが見当たりません。
 ### 該当のソースコード
 ```Python

誤字

2019/05/09 17:10

投稿

pythonista

スコア21

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,10 +1,17 @@
 ### 前提・実現したいこと
-　スクレイピングをして得たHTMLソースコードを
+　JR東日本の中央本線の遅延情報をスクレイピングしたい。
+遅延情報はhtmlの<table>属性で書かれているため、それをスクレイピングしてCSVファイルにしたいが、タグが破損しているため、Pandasのhtml_read()を使えず、BeautifulSoup4でCSVファイル化しようにも、テーブルの要素をすべて取得できないためかなわず。
+そこで、自力でhtmlファイルを修復するプログラムを考えている。
+具体的には、<tr>---</tr>が終了タグ</tr>しかないため</tr>の後ろに<tr>をつけて、しっかりテーブルの行要素をタグで囲ってBeautifulSoup4で取得できるようにしたい。
 ### 発生している問題・エラーメッセージ
+　まず最初に、htmlソースコードを文字列化して、</tr>のインデックスを確かめたい
+そのために、</tr>が文字列中に何回登場するかを計算した。
+JR東日本は過去４５日分の遅延情報を載せているが、プログラムコード結果は２回であった。
+どこがおかしいのか、また、このような原因を自力で発掘するアイデア等があればぜひ教えていただきたいです。初心者の質問であるため、不勉強や説明不足等があれば申し訳ありません。
 ### 該当のソースコード
-```ここに言語名を入力
+```Python
 from bs4 import BeautifulSoup
 from urllib.request import urlopen
@@ -24,12 +31,4 @@
 #実行部
 print(cnt)
-```
+```
-### 試したこと
-ここに問題に対して試したことを記載してください。
-### 補足情報（FW/ツールのバージョンなど）
-ここにより詳細な情報を記載してください。