Python初めて数日の初心者で、プログラミングも勉強始めたばかりです。
最終的にWebスクレイピングができるようになりたいと思っています。
検索してもわからなく、つまづいているので詳しい方教えて下さいm(__)m
Windows10のコマンドプロンプトから実行しています。
★やりたいこと★
食べログで「新橋」「個室」で検索したURLを元に、 店舗名、点数、URLを取得したいです。
■問題■
「店舗名とURL」、「点数」のみ、で個別に取得することはなんとかできたのですが、
合わせる方法がわからず困っています。
理想としては「店舗名」「点数」「URL」をリストにしてエクセルに出力したいです。(ここはまだ勉強中です)
★使用しているコード★
「店舗名とURL」のコードと結果
Python
1 import requests 2 from bs4 import BeautifulSoup 3 4 url = "https://tabelog.com/tokyo/A1301/A130103/R5266/rstLst/?vs=1&sa=%E6%96%B0%E6%A9%8B%E9%A7%85&sk=%25E5%2580%258B%25E5%25AE%25A4&lid=hd_search1&vac_net=&svd=20200323&svt=1900&svps=2&hfc=1&ChkRoom=1&cat_sk=%E5%80%8B%E5%AE%A4" 5 response = requests.get(url) 6 soup = BeautifulSoup(response.content, 'html.parser') 7 8 tags = soup.find_all("a", class_="list-rst__rst-name-target cpy-rst-name") 9 for i in tags: 10... print('name:{} url:{}'.format(i.text, i.get("href"))) 11... 12name:ビアホール ビヤケラー東京 新橋銀座口店 url:https://tabelog.com/tokyo/A1301/A130103/13171590/ 13name:旬魚と個室 和食りん 新橋本店 url:https://tabelog.com/tokyo/A1301/A130103/13100377/ 14name:プレミアムレストラン 東京 金のダイニング 鮪金 url:https://tabelog.com/tokyo/A1301/A130101/13200206/ 15name:DESIGN FOOD MARKET 新橋店 url:https://tabelog.com/tokyo/A1301/A130103/13197015/ 16name:宴会個室 肉寿司 肉食居酒屋 がむしゃら 新橋総本店 url:https://tabelog.com/tokyo/A1301/A130103/13212570/ 17name:鳥元 虎ノ門店 url:https://tabelog.com/tokyo/A1308/A130802/13019433/ 18name:割烹・一品料理 わくら 銀座店 url:https://tabelog.com/tokyo/A1301/A130101/13191311/ 19name:リザラン 新橋店 url:https://tabelog.com/tokyo/A1301/A130103/13211102/ 20name:鉄板焼 ステーキ 集 銀座 url:https://tabelog.com/tokyo/A1301/A130103/13234842/ 21name:官兵衛 url:https://tabelog.com/tokyo/A1301/A130103/13041136/ 22name:無何有 url:https://tabelog.com/tokyo/A1301/A130103/13101397/ 23name:上越やすだ 新橋銀座口店 url:https://tabelog.com/tokyo/A1301/A130103/13189504/ 24name:海鮮個室居酒屋 瀬戸 新橋店 url:https://tabelog.com/tokyo/A1301/A130103/13214639/ 25name:京都 瓢喜 新橋店 url:https://tabelog.com/tokyo/A1301/A130103/13197226/ 26name:肉魚酒場 肉浜 新橋店 url:https://tabelog.com/tokyo/A1301/A130103/13231985/ 27name:NEO‐SNAPPER CARNAVAL url:https://tabelog.com/tokyo/A1301/A130101/13030373/ 28name:京都 瓢喜 銀座本店 url:https://tabelog.com/tokyo/A1301/A130101/13101843/ 29name:個室会席 北大路 銀座本店 url:https://tabelog.com/tokyo/A1301/A130103/13019429/ 30name:陸州や url:https://tabelog.com/tokyo/A1301/A130103/13227422/ 31name:個室 塊肉×農園野菜 Nick&Noojoo 新橋本店 url:https://tabelog.com/tokyo/A1301/A130103/13229555/ 32 33 34**「点数」のコードと結果** 35 36 import requests 37 from bs4 import BeautifulSoup 38 39 url = "https://tabelog.com/tokyo/A1301/A130103/R5266/rstLst/?vs=1&sa=%E6%96%B0%E6%A9%8B%E9%A7%85&sk=%25E5%2580%258B%25E5%25AE%25A4&lid=hd_search1&vac_net=&svd=20200323&svt=1900&svps=2&hfc=1&ChkRoom=1&cat_sk=%E5%80%8B%E5%AE%A4" 40 response = requests.get(url) 41 soup = BeautifulSoup(response.content, "html.parser") 42 43 lists = soup.find_all("span", class_="list-rst__rating-val") 44 45 for list in lists: 46... print(list.text) 47... 483.32 493.44 503.35 513.38 523.06 533.19 543.05 553.26 563.05 573.37 583.14 593.51 603.10 613.09 623.06 633.29 643.51 653.40 663.01 673.40
回答1件
あなたの回答
tips
プレビュー