前提・実現したいこと
このホームページから各施設のタイトルを1〜5ページまでスクレイピングで取得したいと思っています。
https://www.jalan.net/kankou/maj_151000000/page_1/?screenId=OUW1701&influxKbn=0
CSSセレクタで取得すればいいことは調べてなんとなく理解しましたが、どう指定すればいいのかがわかりません。
よろしくお願いいたします。
該当のソースコード
python
1from bs4 import BeautifulSoup 2import urllib.request as req 3import time 4 5page = 1 6last_page = 6 7 8page_num = page 9request_interval = 1 10 11#URL入力 12while page_num < last_page: 13 url = "https://www.jalan.net/kankou/maj_151000000/page_"+ str(page_num) +"/?screenId=OUW1701&influxKbn=0" 14 15 #URLを開く 16 res = req.urlopen(url) 17 #Beautifulsoupで開く 18 soup = BeautifulSoup(res,"html.parser") 19 20 21 #要素の抽出 ここのセレクタの中身をどう指定すればいいのかがわかりません… 22 spot_name = soup.select('a', href_='').text 23 print(spot_name) 24 page_num += 1
回答1件
あなたの回答
tips
プレビュー