teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

1

誤字の修正

2021/06/04 10:44

投稿

szkhd
szkhd

スコア19

title CHANGED
File without changes
body CHANGED
@@ -1,14 +1,14 @@
1
1
  pandasでpd.read_html()関数を使って、HTML上のテーブルをpdのDtaFrameとして読込む処理で苦戦しています。
2
2
 
3
3
  普通にURLを指定してHTMLを読み込むと、ユーザー操作内容によって、取り込みたいテーブルの順番が可変となり、正しく処理できません。
4
- そのため、BeautifulSoupで該当する特定のTableタグ(<table>~</table>)だけを読み込み後にstr()でテキストに変換し、それをpandasのpd.read_html()でDataFrameに変換しようとしましたが、テーブル無しのエラーとなりました。
4
+ そのため、BeautifulSoupで該当する特定のTableタグ(<table>~</table>)だけを読み込みこんだ後にstr()でテキストに変換し、それをpandasのpd.read_html()でDataFrameに変換しようとしましたが、テーブル無しのエラーとなりました。
5
5
  どのようにすれば、pandasのDataFrameとして取り込めるのでしょうか?
6
6
 
7
7
  エラーとなるコード。
8
8
  import bs4
9
9
  import pandas as pd
10
10
  html_text = './test_table.html'
11
- test_table = pd.read_html(html_text
11
+ test_table = pd.read_html(html_text)
12
12
 
13
13
  発生したエラーメッセージ
14
14
  ValueError Traceback (most recent call last)