回答率: 85.48%

質問するログイン新規登録

トップに関する質問このページの映画レビューをすべて取得したい

編集履歴

質問編集履歴

3

質問削除の取り消し

2018/08/31 02:51

投稿

zdadadadadadadz

スコア11

test CHANGED Viewed

	@@ -1 +1 @@
1	- ~~12345678910~~
1	+ このページの映画レビューをすべて取得したい

test CHANGED Viewed

@@ -1 +1,35 @@
+映画に関するレビューのスクレイピングを学習しているのですが1ページ目を取得することが限界で一つの作品に対するすべてのレビューを取得する方法が分からず困っています。例として以下のURLのページを見ると現時点で182件のレビューがついています。これらを一度にすべて取得したいのですが方法がわからないためスクレイピングに詳しいかたよろしくお願いいたします。
+https://movies.yahoo.co.jp/movie/%E3%82%AA%E3%83%BC%E3%82%B7%E3%83%A3%E3%83%B3%E3%82%BA8/363392/review/
+```ここに言語を入力
+import requests
+from bs4 import BeautifulSoup
+URL = "https://movies.yahoo.co.jp/review/"
+BASE_URL = "https://movies.yahoo.co.jp"
+soup = BeautifulSoup(requests.get(url=URL).content, "lxml")
+links = soup.find_all("a", class_="listview__element--right-icon")
+review_urls = []
+for link in links:
+   review_urls.append(f"{BASE_URL}{link.get('href')}")
+results = []
-123456789101234567891012345678910
+for review_url in review_urls:
+   soup = BeautifulSoup(requests.get(url=review_url).content, "lxml")
+   results.append(soup.find("p", class_="text-small text-break text-readable p1em").text.strip())
+[print(result) for result in results]
+```

2

2018/08/31 02:51

投稿

退会済みユーザー

スコア0

test CHANGED Viewed

	@@ -1 +1 @@
1	- ~~このページの映画レビューをすべて取得したい~~
1	+ 12345678910

test CHANGED Viewed

File without changes

1

2018/08/29 11:02

投稿

zdadadadadadadz

スコア11

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -1,49 +1 @@
-映画に関するレビューのスクレイピングを学習しているのですが1ページ目を取得することが限界で一つの作品に対するすべてのレビューを取得する方法が分からず困っています。例として以下のURLのページを見ると現時点で182件のレビューがついています。これらを一度にすべて取得したいのですが方法がわからないためスクレイピングに詳しいかたよろしくお願いいたします。
-https://movies.yahoo.co.jp/movie/%E3%82%AA%E3%83%BC%E3%82%B7%E3%83%A3%E3%83%B3%E3%82%BA8/363392/review/
-```ここに言語を入力
-import requests
-from bs4 import BeautifulSoup
-URL = "https://movies.yahoo.co.jp/review/"
-BASE_URL = "https://movies.yahoo.co.jp"
-soup = BeautifulSoup(requests.get(url=URL).content, "lxml")
-links = soup.find_all("a", class_="listview__element--right-icon")
-review_urls = []
-for link in links:
-    review_urls.append(f"{BASE_URL}{link.get('href')}")
-results = []
-for review_url in review_urls:
+123456789101234567891012345678910
-    soup = BeautifulSoup(requests.get(url=review_url).content, "lxml")
-    results.append(soup.find("p", class_="text-small text-break text-readable p1em").text.strip())
-[print(result) for result in results]
-```