Scrapyを利用してリンクURLを取得しています。
その際に相対パスは取得できたのですが、絶対パスへ変換する事ができません。
.urljoinメソッドを利用すれば対応できるかと思うのですが、
yieldのa の部分へurljoinを設定する方法が思いつきませんでした。
import scrapy class AnimeSpider(scrapy.Spider): name = "test2" start_urls = [ 'http://toyokeizai.net/' ] def parse(self, response): for test in response.css('span.shoulder'): yield { 'a': test.css('a::attr(href)').extract(), 'src': test.css('a::text').extract() }
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/03/14 02:40