htmlデータを抜き出し、CSVへ書き出す方法

pythonでhtmlデータを抜き出しcsvファイルに出力したく、自分で試してみたのですが、エラーが出力されてしまいうまくいかず、質問させてもらいました。


import urllib.request, urllib.error
from bs4 import BeautifulSoup
import csv

# アクセスするURL
url = "https://www.homemate-research-baseball.com/dtl/00000000000000387599/"

# URLを開く
html = urllib.request.urlopen(url)
# BeautifulSoupで開く
soup = BeautifulSoup(html, "html.parser")

mod_adress_head = soup.select_one(".mod_adress_head")
table_adrs = mod_adress_head.select(".adrs")
item_name = table_adrs.select_one(".name")
item_data = table_adrs.select_one(".data")
item_access = table_adrs.select_one(".access")


csvlist = [["","名称","所在地","交通アクセス"]]
# CSVファイルを開く。ファイルがなければ新規作成する。
csvlist.append([item_name])
csvlist.append([item_data])
csvlist.append([item_access])



f = open("output.csv", "w")
writecsv = csv.writer(f, lineterminator='\n')

# 出力
writecsv.writerows(csvlist)

# CSVファイルを閉じる。
f.close()

こちらを実行しますと、以下のエラーが出力されます。

"ResultSet object has no attribute '%s'. You're probably treating a list of elements like a single element. Did you call find_all() when you meant to call find()?" % key

AttributeError: ResultSet object has no attribute 'select_one'. You're probably treating a list of elements like a single element. Did you call find_all() when you meant to call find()?

こちらのエラーの解決のため、ご助言頂けましたら幸いです。
よろしくお願いします。

追記です
エラーの出ている箇所なのですが、

baseball.py", line 17, in <module>
    item_name = table_adrs.select_one(".name")

こちらのように記述されているため、17行目に発生しているものと思われます。

meg_

2020/01/23 14:30

エラーが出ているのは何行目ですか？

ruuuu

2020/01/23 14:44

エラーは「baseball.py", line 17, in <module>」こちらのように記載されていますため、「17行目」かと思われます。

ruuuu

2020/01/23 14:48

すみません。自分の環境では17行目と出ているのですが、コードを質問文に記述する際、少し、いじった為、行がずれてしまっているかもしれないです...

can110

2020/01/23 14:49

17行目ってどこですか？

ruuuu

2020/01/23 14:58 編集

「item_name = table_adrs.select_one(".name")」ここの部分です

行動規範の内容に同意します

回答1件

ベストアンサー

table_adrs = mod_adress_head.select(".adrs")で、.selectを使用していますが、これは返り値にリストを返します。
そのため、table_adrsはリストになっています。リストには、.select_oneを使用できないので、item_name = table_adrs.select_one(".name")の時点でエラーになっていると思われます。

item_name = table_adrs[0].select_one(".name").textのようにリストから要素を特定した上で.select_oneを使えば、個別のテキストを取り出せます（この場合では、「京セラドーム大阪」）。

投稿2020/01/23 14:49

編集2020/01/23 15:10

frederick_1974

総合スコア303

ruuuu

2020/01/23 14:59 編集

ご回答ありがとうございます。教えて頂いた通り、修正しましたら、エラーが消えました。実は、いまいちBeautifulsoupの使い方が分からずにいるのですが、例えば、今回のように「リストには、.select_oneを使用できない」といったことはどこを見ればわかるのでしょうか...? 重ね重ね申し訳ないのですが、教えていただきましたら幸いです。

frederick_1974

2020/01/23 15:08

リストはBeautifulSoupとは全く別のデータ構造です。そのため、リストで、.select_oneメソッドが使えるか否かというよりは、リストで使えるメソッドの中に.select_oneがないと考えた方がいいのではないでしょうか。 .select_oneはBeautifulSoupオブジェクトやTagオブジェクトに対して使用できるものですから。なお、リストで使えるメソッド等は公式の https://docs.python.org/ja/3/tutorial/datastructures.html で見ることができます。

ruuuu

2020/01/23 15:25 編集

ご返信ありがとうございます。大変分かりやすくて、理解することができました... 確かに「.select_one」が使えるのは「BeautifulSoup」オブジェクトだと考えると、分かりやすいですね...

行動規範の内容に同意します