前提・実現したいこと
https://movies.yahoo.co.jp/review/
このサイトのユーザーレビューの内容だけをスクレイピングで抜き出したのですが、あるブログサイトを参考に自分で行ってみたのですがうまくできないため間違いを訂正していただけると助かります。
該当のソースコード
import urllib.request
from bs4 import BeautifulSoup
url = 'https://movies.yahoo.co.jp/review/'
ua = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_3) '
'AppleWebKit/537.36 (KHTML, like Gecko) '
'Chrome/55.0.2883.95 Safari/537.36 '
req = urllib.request.Request(url, headers={'User-Agent': ua})
html = urllib.request.urlopen(req)
soup = BeautifulSoup(html, "html.parser")
text-small text-break text-readable p1em = soup.find('p', attrs={'class':'text-small text-break text-readable p1em'})
試したこと
タグのひっぱってくる場所などをいろいろ変えてみたのですがうまくいきません、、、
補足情報(FW/ツールのバージョンなど)
https://note.nkmk.me/python-beautiful-soup-scraping-yahoo/
参考にしたサイトです。
回答1件
あなたの回答
tips
プレビュー