実現したいこと
Pythonでサーバを立て、その上で動的サイトのスクレイピングをしようとしています。
該当のソースコード
main.py
1import flask 2from requests_html import AsyncHTMLSession 3import asyncio 4from flask import request 5 6app = flask.Flask(__name__) 7app.url_map.strict_slashes = False 8 9 10async def exec_js(): 11 asession = AsyncHTMLSession() 12 resp = await asession.get("https://pycon.jp/2019/") 13 print("before:", resp.html.links) # => set() 14 await resp.html.arender() 15 print("after", resp.html.links) # => {'https://pyconjp.connpass.com/event/139133/', ...} 16 17 18@app.route("/<website>/<user>") 19def get(website, user): 20 loop = asyncio.new_event_loop() 21 loop.run_until_complete(exec_js()) 22 23 24if __name__ == "__main__": 25 app.run()
発生している問題・エラーメッセージ
exec_js関数の中のawait resp.html.arender()
で
ValueError: signal only works in main thread
というエラーが出ています。
試したこと
ValueError: signal only works in main thread
と検索して上位に出てくるサイトに書いてあったこと全て試しました。
また、この部分のawaitを外すことでエラーが消え、読み込まれる前のサイトデータを収集できるところまで把握しています。

あなたの回答
tips
プレビュー