Beautifulsoupとrequestsを使って厚生労働省(https://www.mhlw.go.jp/stf/newpage_11043.html)の以下の画像ファイルをスクレイピングにより取得しようとしているのですが出来ませんでした。
恐らくimgに指定の画像が入っていると思います。
取得した画像ファイルが特別なものなのでしょうか。
どなたかお分かりになる方、質問にお答えくださると幸いです。
よろしくお願いいたします。
python3
1import requests 2from bs4 import BeautifulSoup 3from lxml import html 4 5target_url='https://www.mhlw.go.jp/stf/newpage_11043.html' 6res = requests.get(target_url) 7res.raise_for_status() 8soup = bs4.BeautifulSoup(res.content, "html.parser") 9elems=soup.select('a') 10img=soup.select('.m-grid__col1')[0].find('img') 11r = requests.get(img['src']) 12with open(str('./picture/')+str(uuid.uuid4())+str('.jpeg'),'wb') as file: 13 file.write(r.content)
--------------------------------------------------------------------------- InvalidSchema Traceback (most recent call last) <ipython-input-475-b6e5e58c21be> in <module> ----> 1 r = requests.get(img['src']) 2 with open(str('./picture/')+str(uuid.uuid4())+str('.jpeg'),'wb') as file: 3 file.write(r.content) /usr/local/lib/python3.7/site-packages/requests/api.py in get(url, params, **kwargs) 73 74 kwargs.setdefault('allow_redirects', True) ---> 75 return request('get', url, params=params, **kwargs) 76 77 /usr/local/lib/python3.7/site-packages/requests/api.py in request(method, url, **kwargs) 58 # cases, and look like a memory leak in others. 59 with sessions.Session() as session: ---> 60 return session.request(method=method, url=url, **kwargs) 61 62 /usr/local/lib/python3.7/site-packages/requests/sessions.py in request(self, method, url, params, data, headers, cookies, files, auth, timeout, allow_redirects, proxies, hooks, stream, verify, cert, json) 531 } 532 send_kwargs.update(settings) --> 533 resp = self.send(prep, **send_kwargs) 534 535 return resp /usr/local/lib/python3.7/site-packages/requests/sessions.py in send(self, request, **kwargs) 638 639 # Get the appropriate adapter to use --> 640 adapter = self.get_adapter(url=request.url) 641 642 # Start time (approximately) of the request /usr/local/lib/python3.7/site-packages/requests/sessions.py in get_adapter(self, url) 729 730 # Nothing matches :-/ --> 731 raise InvalidSchema("No connection adapters were found for '%s'" % url) 732 733 def close(self): InvalidSchema: No connection adapters were found for 'data:image/png;base64,iVBORw0KGgoA・・・'
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/04/28 13:30
2020/04/28 13:46
2020/04/28 13:48
2020/04/29 05:48
2020/04/29 06:14
2020/04/30 07:15