Python 食べログで店舗名のURLのみ取得したいです。

Python初めて数日の初心者で、プログラミングも勉強始めたばかりです。
最終的にWebスクレイピングができるようになりたいと思っています。

★やりたいこと★

食べログで「新橋」「個室」で検索したURLを元に、
店舗名のURLを取得したいのです。

■問題■
その店舗ページのすべてのURLが取得されてしまいます。

★使用しているコード★
import requests
from bs4 import BeautifulSoup

url = "https://tabelog.com/tokyo/A1301/A130103/R5266/rstLst/?vs=1&sa=%E6%96%B0%E6%A9%8B%E9%A7%85&sk=%25E5%2580%258B%25E5%25AE%25A4&lid=hd_search1&vac_net=&svd=20200323&svt=1900&svps=2&hfc=1&ChkRoom=1&cat_sk=%E5%80%8B%E5%AE%A4"
response = requests.get(url)
soup = BeautifulSoup(res, 'html.parser')

tags = soup.find_all("a")
for i in tags:
print(i.get("href"))

■実行結果■
None
https://tabelog.com/
https://tabelog.com/
https://tabelog.com/tokyo/
https://tabelog.com/tokyo/A1301/
https://tabelog.com/tokyo/A1301/A130103/
/sitemap/tokyo/A1301-A130103/

検索してみてもわからず、、どなたか解決策を教えていただきたいです。
宜しくお願いしますm(__)m

yodel

2020/03/23 07:55 編集

可読性のため、ソースコードは、ソースコード部分をドラッグして<code>ボタンを利用して「```」で始まりと終わりを囲うようにしてください。

pythonbegginer

2020/03/23 08:35

大変失礼いたしましたm(__)m

行動規範の内容に同意します

回答1件

ベストアンサー

一番簡単な解決方法はクラス名を検索条件に追加することかと思います。
今のコードでは

Python
1tags = soup.find_all("a")

としか書いていませんから、ページ内のすべてのaタグを取得してしまいます。

欲しいのは個別のページにリンクしているaタグですので、そこに適用されているクラス名を特定して検索条件に加えれば解決できます。

Python
1tags = soup.find_all("a", class_="list-rst__rst-name-target cpy-rst-name")

今回はこれで解決できましたが、ページ仕様が変わったり、スクレイピング対策をしているページでは使えないこともあるので、あくまで解決方法の一つとしてご認識ください。

参考にコード全体も貼っておきます。

Python
1import requests
2from bs4 import BeautifulSoup
3
4url = "https://tabelog.com/tokyo/A1301/A130103/R5266/rstLst/?vs=1&sa=%E6%96%B0%E6%A9%8B%E9%A7%85&sk=%25E5%2580%258B%25E5%25AE%25A4&lid=hd_search1&vac_net=&svd=20200323&svt=1900&svps=2&hfc=1&ChkRoom=1&cat_sk=%E5%80%8B%E5%AE%A4"
5response = requests.get(url)
6soup = BeautifulSoup(response.content, 'html.parser')
7
8tags = soup.find_all("a", class_="list-rst__rst-name-target cpy-rst-name")
9for i in tags:
10  print('name:{} url:{}'.format(i.text, i.get("href")))