ScrapyとScrapy Splashを利用しあるサイトのスクレイピングをしています。
しかし、対象サイトはHTMLを読み込んだ後にJSで項目を表示するようになっており、完全表示までにブラウザで3~5秒ほどかかります。
Scrapyは1ページ10秒程度のウェイトをかけていますが、Splashからは内容が常に空で返ってきてしまいます。
実現したいこと
- ScrapyでSplashに読み込み要求
- Splash側で5秒ほど完全レンダリングを待つ
- Scrapyで取得
ScrapyでウェイトをかけてもSplashへの要求の前(1の前)で待っているだけで、Splash自体は一瞬で読み込んでしまいJSの部分が空になっています。
- Splash側で完全レンダリングを待つオプションなど
- Splashへ要求を出した後に読み込む方法
このような方法が無いか探しています。
どなたかヒントをお持ちの方は教えてください。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/08/03 01:09