回答編集履歴

Update

2022/03/28 05:10

投稿

スコア21745

answer CHANGED Viewed

@@ -10,7 +10,7 @@
 r = requests.get(page_url, headers=headers)
 soup = BeautifulSoup(r.content, 'lxml')
-img_tag = soup.select_one('div[class^="cover"] img')
+img_tag = soup.select_one('div.book-cover > img')
 img_url = img_tag['src']
 print(img_url)

Update

2022/03/28 05:05

投稿

スコア21745

answer CHANGED Viewed

@@ -1,8 +1,7 @@
-カバー画像は JavaScript によって配置されていますので、その JavaScript コードの本文から URL を取得します。
+`User-Agent` を設定する必要がある様です。
 ```python
 import requests
-import re
-import json
+from bs4 import BeautifulSoup
 page_url = "https://www.sciencedirect.com/book/9780124157590/haschek-and-rousseauxs-handbook-of-toxicologic-pathology"
 headers = {
@@ -10,11 +9,11 @@
 }
 r = requests.get(page_url, headers=headers)
-m = re.findall(r'(?<=var reduxData = )(.+?)(?=;\n)', r.text)
+soup = BeautifulSoup(r.content, 'lxml')
-if m:
-  cover_url = json.loads(m[0])['simpleBook']['coverImages']['large']
+img_tag = soup.select_one('div[class^="cover"] img')
+img_url = img_tag['src']
-  print(cover_url)
+print(img_url)
 #
 https://ars.els-cdn.com/content/image/3-s2.0-C20101678509-cov200h.gif
-```
+```