実現したいこと
このコードの続きから「福岡県糟屋郡粕屋町大字戸原637番地」というテキストを取得したいです。
前提
BeautifulSoupを用いて求人サイトから、求人をしている企業の住所を取得しています。その際、ソースコードでは「住所」というテキストがprint(addresses.text)で出力されますが、その状態から「福岡県糟屋郡粕屋町大字戸原637番地」というテキストのみを出力したいです。
発生している問題・エラーメッセージ
エラーは出ていません
該当のソースコード
Python
1cp_page_url = 'https://atsumaru.jp/area/detail?kno=X109214&said=7&shn=980&vol=00001' 2 3page_r = requests.get(cp_page_url) 4page_r.raise_for_status() 5page_soup = BeautifulSoup(page_r.content, 'lxml') 6 7addresses = page_soup.select('div.bl_card2_table.bl_card2_table__wide th:-soup-contains("住所")')
試したこと
・addresses = page_soup.select('div.bl_card2_table.bl_card2_table__wide th:-soup-contains("住所")') > td > p
としてみましたが、何も出力されませんでした。
・ソースコードの続きに
print(addresses.select('td > p').text)
としましたが、
AttributeError: ResultSet object has no attribute 'select'. You're probably treating a list of elements like a single element. Did you call find_all() when you meant to call find()?
というエラーが出ました。
補足情報(FW/ツールのバージョンなど)
Pythonのバージョン:3.10.9
使用PC:Intel MacBook
バージョン:macOS Monterey Version 12.4
実装環境:Jupyter Lab
Chromeのバージョン:112.0.5615.137
ChromeDriverのバージョン:112.0.5615.49
selenium 4.9.0
回答1件
あなたの回答
tips
プレビュー
下記のような回答は推奨されていません。
このような回答には修正を依頼しましょう。
また依頼した内容が修正された場合は、修正依頼を取り消すようにしましょう。
2023/05/14 21:28
2023/05/15 01:27