teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

3

タイトルを編集

2018/10/30 09:48

投稿

fukazume
fukazume

スコア78

title CHANGED
@@ -1,1 +1,1 @@
1
- scrapy shell, response.xpath().extract()で抽出不可
1
+ Scrapy, response.xpath().extract()で抽出結果が空欄
body CHANGED
File without changes

2

説明追記

2018/10/30 09:47

投稿

fukazume
fukazume

スコア78

title CHANGED
File without changes
body CHANGED
@@ -1,7 +1,7 @@
1
1
  ###■経緯
2
2
  - 以前、[類似質問をTeratail
3
3
  ](https://teratail.com/questions/154179)でさせていただき、その時は頂いたアドバイスのとおりUSER_AGENTを指定することでyahoo.co.jpから正常にXpath抽出ができました。
4
- - 今回、[別のサイト(amazon.co.jp)](https://www.amazon.co.jp/%E6%9C%AC-%E9%80%9A%E8%B2%A9/b/ref=sd_allcat_jb?ie=UTF8&node=465392)で、Xpathで抽出できずに[]という空(?)の値が返ってくる現象に遭遇しました。
4
+ - 今回、[別のサイト(amazon.co.jp)](https://www.amazon.co.jp/%E6%9C%AC-%E9%80%9A%E8%B2%A9/b/ref=sd_allcat_jb?ie=UTF8&node=465392)で、CSSでは抽出できるのにXpathで抽出できずに[]という空(?)の値が返ってくる現象に遭遇しました。
5
5
 
6
6
  ###■質問
7
7
  以下の環境で、Xpathにてテキスト(例: Tarzan(ターザン) 2018年11月8日号 No.752※)が正常に抽出できる方法を教えていただけますでしょうか?

1

誤字訂正

2018/10/29 07:30

投稿

fukazume
fukazume

スコア78

title CHANGED
File without changes
body CHANGED
@@ -1,7 +1,7 @@
1
1
  ###■経緯
2
2
  - 以前、[類似質問をTeratail
3
3
  ](https://teratail.com/questions/154179)でさせていただき、その時は頂いたアドバイスのとおりUSER_AGENTを指定することでyahoo.co.jpから正常にXpath抽出ができました。
4
- - 今回、[別のサイト(amazon.co.jp)](https://www.amazon.co.jp/%E6%9C%AC-%E9%80%9A%E8%B2%A9/b/ref=sd_allcat_jb?ie=UTF8&node=465392)で、Xpathで抽出できずに[]という空(?)の値が返ってくる現象に遭遇しました。
4
+ - 今回、[別のサイト(amazon.co.jp)](https://www.amazon.co.jp/%E6%9C%AC-%E9%80%9A%E8%B2%A9/b/ref=sd_allcat_jb?ie=UTF8&node=465392)で、Xpathで抽出できずに[]という空(?)の値が返ってくる現象に遭遇しました。
5
5
 
6
6
  ###■質問
7
7
  以下の環境で、Xpathにてテキスト(例: Tarzan(ターザン) 2018年11月8日号 No.752※)が正常に抽出できる方法を教えていただけますでしょうか?