質問編集履歴

4/11追記しました

2018/04/10 15:55

投稿

スコア80

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -34,7 +34,7 @@
->>> response.xpath('//*[@id="topicsfb"]/div[1]/ul[1]/li[1]/a/text()').extract()
+＞＞＞ response.xpath('//*[@id="topicsfb"]/div[1]/ul[1]/li[1]/a/text()').extract()
 []
@@ -64,7 +64,7 @@
 ...
->>> response.xpath('//*[@id="images"]/a[2]')
+＞＞＞ response.xpath('//*[@id="images"]/a[2]')
 [<Selector xpath='//*[@id="images"]/a[2]' data='<a href="image2.html">Name: My i
@@ -84,4 +84,14 @@
-ここにより詳細な情報を記載してください。
+4/11追記
+ヤフーニュース(co.jp)のスクレイピングができませんと記しましたが、その後原因を調べるためにいろいろ試しました。その途中経過を記します。
+teratailでメルカリのscrapyができないのでその結果を確認しました。結果は[]のみ(ヤフーニュースと同じ結果。）
+ヤフーファイナンスで自動取得が禁止されているとのことでしたので確認しました。結果は指定した要素を取得できました。
+私の考えでは、スクレイピングが禁止されている対象では、何らかの方法でscrapyが上手く起動せず[]のみ結果が吐き出されるのではないかと思っていましたが、それはないみたいです。
+yahoo.comのニュースもスクレイピングしてみましたが[]のみの結果が吐き出されました。英文から原因を調べてみようと思います。