実現したいこと
pythonのrequests_htmlライブラリを利用してあるサイトの画面キャプチャを取得したいと考えております。
実装したソースコード
以下に実装したコードを記します。
python
1from requests_html import AsyncHTMLSession 2 3import json 4 5def hello(event, context): 6 asession = AsyncHTMLSession() 7 8 async def process(): 9 url = "https://google.com" 10 11 r = await asession.get(url) 12 await r.html.arender(wait=3, sleep=3, keep_page=True) 13 await r.html.page.screenshot({"path": "/tmp/ss.png", "fullPage": True}) 14 return r 15 16 r = asession.run(process)[0] 17 18 body = {"message": "Go Serverless v1.0! Your function executed successfully!", "input": event} 19 20 response = {"statusCode": 200, "body": json.dumps(body)} 21 22 return response
発生している問題・エラーメッセージ
以下のエラーが表示されてしまい、処理が終了してしまいます。
エラー内容を見る限りでは、arenderの際に'/home/sbx_user1051'に情報を書き込もうとしているが、
tmp領域にしか書き込めないはずなため、エラーとなっているように見える。
"errorMessage": "[Errno 30] Read-only file system: '/home/sbx_user1051'", "errorType": "OSError", "stackTrace": [ " File \"/var/task/handler.py\", line 19, in hello\n r = asession.run(process)[0]\n", " File \"/var/task/requests_html.py\", line 775, in run\n return [t.result() for t in done]\n", " File \"/var/task/requests_html.py\", line 775, in <listcomp>\n return [t.result() for t in done]\n", " File \"/var/task/handler.py\", line 15, in process\n await r.html.arender(wait=3, sleep=3, keep_page=True)\n", " File \"/var/task/requests_html.py\", line 615, in arender\n self.browser = await self.session.browser\n", " File \"/var/task/requests_html.py\", line 714, in browser\n self._browser = await pyppeteer.launch(ignoreHTTPSErrors=not(self.verify), headless=True, args=self.__browser_args)\n", " File \"/var/task/pyppeteer/launcher.py\", line 306, in launch\n return await Launcher(options, **kwargs).launch()\n", " File \"/var/task/pyppeteer/launcher.py\", line 112, in __init__\n CHROME_PROFILE_PATH.mkdir(parents=True)\n", " File \"/var/lang/lib/python3.8/pathlib.py\", line 1292, in mkdir\n self.parent.mkdir(parents=True, exist_ok=True)\n", " File \"/var/lang/lib/python3.8/pathlib.py\", line 1292, in mkdir\n self.parent.mkdir(parents=True, exist_ok=True)\n", " File \"/var/lang/lib/python3.8/pathlib.py\", line 1292, in mkdir\n self.parent.mkdir(parents=True, exist_ok=True)\n", " [Previous line repeated 1 more time]\n", " File \"/var/lang/lib/python3.8/pathlib.py\", line 1288, in mkdir\n self._accessor.mkdir(self, mode)\n" ] }
調査して分かったこと(2021/08/14 更新)
arender()で内部的に呼び出ししているpyppeteerに問題がありそう。
初回起動時にChromiumをダウンロードしてきているが、そのダウンロード先がtmpディレクトリではないため、
書き込み権限がなくエラーとなっている。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。