質問編集履歴

タイトルを編集

2018/10/30 09:48

投稿

スコア78

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- ~~scrapy shell~~, response.xpath().extract()で抽出不可
1	+ Scrapy, response.xpath().extract()で抽出結果が空欄

body CHANGED Viewed

File without changes

説明追記

2018/10/30 09:47

投稿

スコア78

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,7 +1,7 @@
 ###■経緯
 - 以前、[類似質問をTeratail
 ](https://teratail.com/questions/154179)でさせていただき、その時は頂いたアドバイスのとおりUSER_AGENTを指定することでyahoo.co.jpから正常にXpath抽出ができました。
-- 今回、[別のサイト（amazon.co.jp）](https://www.amazon.co.jp/%E6%9C%AC-%E9%80%9A%E8%B2%A9/b/ref=sd_allcat_jb?ie=UTF8&node=465392)で、Xpathで抽出できずに[]という空(?)の値が返ってくる現象に遭遇しました。
+- 今回、[別のサイト（amazon.co.jp）](https://www.amazon.co.jp/%E6%9C%AC-%E9%80%9A%E8%B2%A9/b/ref=sd_allcat_jb?ie=UTF8&node=465392)で、CSSでは抽出できるのにXpathで抽出できずに[]という空(?)の値が返ってくる現象に遭遇しました。
 ###■質問
 以下の環境で、Xpathにてテキスト（例: Tarzan(ターザン) 2018年11月8日号 No.752※）が正常に抽出できる方法を教えていただけますでしょうか？

誤字訂正

2018/10/29 07:30

投稿

スコア78

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,7 +1,7 @@
 ###■経緯
 - 以前、[類似質問をTeratail
 ](https://teratail.com/questions/154179)でさせていただき、その時は頂いたアドバイスのとおりUSER_AGENTを指定することでyahoo.co.jpから正常にXpath抽出ができました。
-- 今回、[別のサイト（amazon.co.jp）](https://www.amazon.co.jp/%E6%9C%AC-%E9%80%9A%E8%B2%A9/b/ref=sd_allcat_jb?ie=UTF8&node=465392)では、Xpathで抽出できずに[]という空(?)の値が返ってくる現象に遭遇しました。
+- 今回、[別のサイト（amazon.co.jp）](https://www.amazon.co.jp/%E6%9C%AC-%E9%80%9A%E8%B2%A9/b/ref=sd_allcat_jb?ie=UTF8&node=465392)で、Xpathで抽出できずに[]という空(?)の値が返ってくる現象に遭遇しました。
 ###■質問
 以下の環境で、Xpathにてテキスト（例: Tarzan(ターザン) 2018年11月8日号 No.752※）が正常に抽出できる方法を教えていただけますでしょうか？