質問編集履歴
1
誤字の修正
title
CHANGED
File without changes
|
body
CHANGED
@@ -1,14 +1,14 @@
|
|
1
1
|
pandasでpd.read_html()関数を使って、HTML上のテーブルをpdのDtaFrameとして読込む処理で苦戦しています。
|
2
2
|
|
3
3
|
普通にURLを指定してHTMLを読み込むと、ユーザー操作内容によって、取り込みたいテーブルの順番が可変となり、正しく処理できません。
|
4
|
-
そのため、BeautifulSoupで該当する特定のTableタグ(<table>~</table>)だけを読み込み後にstr()でテキストに変換し、それをpandasのpd.read_html()でDataFrameに変換しようとしましたが、テーブル無しのエラーとなりました。
|
4
|
+
そのため、BeautifulSoupで該当する特定のTableタグ(<table>~</table>)だけを読み込みこんだ後にstr()でテキストに変換し、それをpandasのpd.read_html()でDataFrameに変換しようとしましたが、テーブル無しのエラーとなりました。
|
5
5
|
どのようにすれば、pandasのDataFrameとして取り込めるのでしょうか?
|
6
6
|
|
7
7
|
エラーとなるコード。
|
8
8
|
import bs4
|
9
9
|
import pandas as pd
|
10
10
|
html_text = './test_table.html'
|
11
|
-
test_table = pd.read_html(html_text
|
11
|
+
test_table = pd.read_html(html_text)
|
12
12
|
|
13
13
|
発生したエラーメッセージ
|
14
14
|
ValueError Traceback (most recent call last)
|