Q&A
実現したいこと
webサイトからテキスト情報を取得しようとしています。
javaを使っているサイトの場合、Beautifulsoupは使えずrequests-htmlを使えばいいことがわかりました。
解説サイトを参考に、まずはgoogle検索をしてみたらレンダリングの箇所でエラーが発生します。
これはどのサイトで実行しても同じでした。
対処の仕方がわかりません。
ご教示をお願いします。
発生している問題・エラーメッセージ
Traceback (most recent call last): File "C:\Users\Administrator\AppData\Local\Programs\Python\Python38\lib\runpy.py", line 193, in _run_module_as_main return _run_code(code, main_globals, None, File "C:\Users\Administrator\AppData\Local\Programs\Python\Python38\lib\runpy.py", line 86, in _run_code exec(code, run_globals) File "c:\Users\Administrator\.vscode\extensions\ms-python.python-2022.6.3\pythonFiles\lib\python\debugpy\__main__.py", line 45, in <module> cli.main() File "c:\Users\Administrator\.vscode\extensions\ms-python.python-2022.6.3\pythonFiles\lib\python\debugpy/..\debugpy\server\cli.py", line 444, in main run() File "c:\Users\Administrator\.vscode\extensions\ms-python.python-2022.6.3\pythonFiles\lib\python\debugpy/..\debugpy\server\cli.py", line 285, in run_file runpy.run_path(target_as_str, run_name=compat.force_str("__main__")) File "C:\Users\Administrator\AppData\Local\Programs\Python\Python38\lib\runpy.py", line 263, in run_path return _run_module_code(code, init_globals, run_name, File "C:\Users\Administrator\AppData\Local\Programs\Python\Python38\lib\runpy.py", line 96, in _run_module_code _run_code(code, mod_globals, init_globals, File "C:\Users\Administrator\AppData\Local\Programs\Python\Python38\lib\runpy.py", line 86, in _run_code exec(code, run_globals) File "c:\Users\Administrator\Documents\xxxxxxxx\PY\test.py", line 11, in <module> r.html.render(timeout=0, sleep=10) File "C:\Users\Administrator\AppData\Local\Programs\Python\Python38\lib\site-packages\requests_html.py", line 586, in render self.browser = self.session.browser # Automatically create a event loop and browser File "C:\Users\Administrator\AppData\Local\Programs\Python\Python38\lib\site-packages\requests_html.py", line 730, in browser self._browser = self.loop.run_until_complete(super().browser) File "C:\Users\Administrator\AppData\Local\Programs\Python\Python38\lib\asyncio\base_events.py", line 612, in run_until_complete return future.result() File "C:\Users\Administrator\AppData\Local\Programs\Python\Python38\lib\site-packages\requests_html.py", line 714, in browser self._browser = await pyppeteer.launch(ignoreHTTPSErrors=not(self.verify), headless=True, args=self.__browser_args) File "C:\Users\Administrator\AppData\Local\Programs\Python\Python38\lib\site-packages\pyppeteer\launcher.py", line 307, in launch return await Launcher(options, **kwargs).launch() File "C:\Users\Administrator\AppData\Local\Programs\Python\Python38\lib\site-packages\pyppeteer\launcher.py", line 168, in launch self.browserWSEndpoint = get_ws_endpoint(self.url) File "C:\Users\Administrator\AppData\Local\Programs\Python\Python38\lib\site-packages\pyppeteer\launcher.py", line 227, in get_ws_endpoint raise BrowserError('Browser closed unexpectedly:\n') pyppeteer.errors.BrowserError: Browser closed unexpectedly:
該当のソースコード
python
1from requests_html import HTMLSession 2 3session = HTMLSession() 4#検索に利用するサイト 5url = "https://www.google.com/" 6#検索するワード 7word = "python" 8r = session.get(url + "search?q=" + word) 9r.html.render()
試したこと
タイムアウト等のオプションを設定
r.html.render(timeout=0, sleep=10)
エラー内容に変化なし
補足情報(FW/ツールのバージョンなど)
os: Windows
python: 3.8.1
回答1件
あなたの回答
tips
プレビュー
下記のような回答は推奨されていません。
このような回答には修正を依頼しましょう。
2022/06/07 01:37
2022/06/07 02:13
2022/06/07 07:17
2022/06/07 07:31
2022/06/07 07:49
2022/06/07 08:00
2022/06/07 08:05