前提・実現したいこと
Pythonでサイト内検索の結果を表示するプログラムを作成しています。
検索結果1ページめのタイトルの部分だけを表示したいのですが、for文でリストの最初の要素だけがループしてしまいます。
発生している問題・エラーメッセージ
出力結果 【検索ワード】東京 ['支援金:「大多喜町移住支援事業支援金」', '支援金:「大多喜町移住支援事業支援金」', '支援金:「大多喜町移住支援事業支援金」', '支援金:「大多喜町移住支援事業支援金」', '支援金:「大多喜町移住支援事業支援金」', '支援金:「大多喜町移住支援事業支援金」', '支援金:「大多喜町移住支援事業支援金」', '支援金:「大多喜町移住支援事業支援金」', '支援金:「大多喜町移住支援事業支援金」', '支援金:「大多喜町移住支援事業支援金」']
該当のソースコード
Python
1print(f'【検索ワード】東京') 2 3url=f'https://j-net21.smrj.go.jp/snavi/support?genre1=3&genre2=&freeWord=東京&order=DESC&perPage=10&page=1' 4request = requests.get(url) 5soup = BeautifulSoup(request.text, "html.parser") 6search_site_list = soup.select('div.title-meta > a') 7 8title_list=[] 9 10for i in search_site_list: 11 title=soup.find("a",class_="title").get_text() 12 title_list.append(title) 13 14print(title_list)
試したこと
前半の
search_site_list = soup.select('div.title-meta > a')
のあとに
print(search_site_list)
を入力すると、search_site_listはきちんと作成できていることが分かりました。さらに[1]などを入れてみて、要素の分割位置も正しいことが分かっています。また、for文のsearch_site_listにカーソルオンすると、(10 items)[Tag with 1 item, Tag with...]の表示が出て、引用もきちんとできているようです。
当初のコードではtitle_listを作成せずtitleからそのままprintするコードでしたが、それだと最初の要素だけの表示になり、リスト化がされませんでした。title_listを設置したことで複数の要素が出てくるようにはなりましたが、それがすべて同じ要素という状態です。
そもそもsoup.find(class_="title")にすると、search_site_list内には存在しない文字列(元のサイト内には存在する"p"のクラス)が呼び出されます。
for文の指定の仕方が間違っているのかと、iをsite,search_site,elemsなど色々変えてみましたが、出力結果は変わりませんでした。
補足情報(FW/ツールのバージョンなど)
使用ツールはgoogle colaboratoryです。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2022/01/08 08:55