scrapy で Chrome ウェブストアのクロールを試みています。
アプリのタイトル、URL、★などの情報をxpathで取得したいのですが、どうしてもうまくいきません。
お力添え願えますでしょうか。
■やったこと
- 下図赤枠のアプリタイトルのxpathを取得
xpath
1/html/body/div[3]/div[4]/main/div/div[1]/div/div[1]/div[3]/div[1]/div[1]/a/div/div[2]/div[3]/h3/
- User Agentを指定して scrapy shell を起動
scrapy_shell
1scrapy shell -s USER_AGENT='Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36' 'https://chrome.google.com/webstore/category/extensions?hl=ja'
- scrapy shell でデータの確認(値が返ってこない)
scrapy_shell
1response.xpath('/html/body/div[3]/div[4]/main/div/div[1]/div/div[1]/div[3]/div[1]/div[1]/a/div/div[2]/div[3]/h3/').extract()
■想定する挙動
scrapy shell の結果が「TunnelBear」となる
ちなみに、以下のコマンドを実行した場合は正常に値が帰ってきます。
response.xpath('/html/head/title/text()').extract()
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2022/02/03 07:17