回答編集履歴

3

追記

2018/04/03 23:29

投稿

trafalbad
trafalbad

スコア303

test CHANGED
@@ -10,7 +10,7 @@
10
10
 
11
11
 
12
12
 
13
- とりあえずreferenceはCSSセレクターなのでscrapyの[これ](http://scrapy-ja.readthedocs.io/ja/latest/topics/selectors.html)。
13
+ とりあえずreferenceはCSSセレクターなのでscrapyの[これ](http://scrapy-ja.readthedocs.io/ja/latest/topics/selectors.html)。また[scrapyのspiderのも](http://scrapy-ja.readthedocs.io/ja/latest/topics/spiders.html)良いです。
14
14
 
15
15
  base URLを取得したいときは
16
16
 

2

変更

2018/04/03 23:29

投稿

trafalbad
trafalbad

スコア303

test CHANGED
@@ -26,7 +26,7 @@
26
26
 
27
27
 
28
28
 
29
- を指定したやるので、この解釈だと<img>タグのclass=js-map-lazyloadなので
29
+ を指定したやるので、この解釈だとclass=js-map-lazyloadの<img>タグのdata-original属性を取得する」ということにります
30
30
 
31
31
 
32
32
 

1

追記

2018/04/03 23:27

投稿

trafalbad
trafalbad

スコア303

test CHANGED
@@ -30,8 +30,30 @@
30
30
 
31
31
 
32
32
 
33
+ ```
34
+
33
- ```response.css('<タグ名>.<クラス名>::attr(<URLの属性>)')```
35
+ response.css('<タグ名>.<クラス名>::attr(<URLの属性>)')
36
+
37
+ ```
34
38
 
35
39
 
36
40
 
37
41
  という指定でいいかと
42
+
43
+
44
+
45
+ extract_first()は最初の要素(data-original属性の要素)を取り出します。
46
+
47
+
48
+
49
+ ```
50
+
51
+ In [1]: response.css('img.js-map-lazyload::attr("data-original")').extract_first()
52
+
53
+
54
+
55
+
56
+
57
+ Out[1]: 'https://maps.googleapis.com/maps/api/staticmap?client=gme-kakakucominc&channel=tabelog.com&sensor=false&hl=ja&center=35.729935105434045,139.6771439234143&markers=color:red%7C35.729935105434045,139.6771439234143&zoom=15&size=490x145&signature=VSZ6kU86WFstcOCQz9OYcWo-6EM='
58
+
59
+ ```