BSを用いて、出力したテキストから別のタグにあるテキストを出力したい

実現したいこと

このコードの続きから「福岡県糟屋郡粕屋町大字戸原637番地」というテキストを取得したいです。

前提

BeautifulSoupを用いて求人サイトから、求人をしている企業の住所を取得しています。その際、ソースコードでは「住所」というテキストがprint(addresses.text)で出力されますが、その状態から「福岡県糟屋郡粕屋町大字戸原637番地」というテキストのみを出力したいです。

発生している問題・エラーメッセージ

エラーは出ていません

該当のソースコード

Python
1cp_page_url = 'https://atsumaru.jp/area/detail?kno=X109214&said=7&shn=980&vol=00001'
2    
3page_r = requests.get(cp_page_url)
4page_r.raise_for_status()
5page_soup = BeautifulSoup(page_r.content, 'lxml')
6    
7addresses = page_soup.select('div.bl_card2_table.bl_card2_table__wide th:-soup-contains("住所")')

試したこと

・addresses = page_soup.select('div.bl_card2_table.bl_card2_table__wide th:-soup-contains("住所")') > td > p
としてみましたが、何も出力されませんでした。

・ソースコードの続きに
print(addresses.select('td > p').text)
としましたが、
AttributeError: ResultSet object has no attribute 'select'. You're probably treating a list of elements like a single element. Did you call find_all() when you meant to call find()?
というエラーが出ました。

補足情報（FW/ツールのバージョンなど）

Pythonのバージョン：3.10.9

使用PC：Intel MacBook

バージョン：macOS Monterey Version 12.4

実装環境：Jupyter Lab

Chromeのバージョン：112.0.5615.137

ChromeDriverのバージョン：112.0.5615.49

selenium 4.9.0

行動規範の内容に同意します

回答1件

ベストアンサー

python
1addresses = page_soup.select_one('tr:has(th:-soup-contains("住所")) td p:first-child')
2print(addresses.text)
3
4# 福岡県糟屋郡粕屋町大字戸原637番地

投稿2023/05/14 01:23

melian

総合スコア21118

loulou098

2023/05/14 21:28

ご回答ありがとうございます！しっかりと出力できました！ちなみにですが、 tr:has(th:-soup-contains("住所") はthタグに"住所"と書かれていた時のみtrタグを取得するという解釈であっていますか？

melian

2023/05/15 01:27

はい、その通りです。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.31%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

BSを用いて、出力したテキストから別のタグにあるテキストを出力したい

実現したいこと

前提

発生している問題・エラーメッセージ

該当のソースコード

試したこと

補足情報（FW/ツールのバージョンなど）

関連した質問