回答編集履歴
3
追記
test
CHANGED
@@ -10,7 +10,7 @@
|
|
10
10
|
|
11
11
|
|
12
12
|
|
13
|
-
とりあえずreferenceはCSSセレクターなのでscrapyの[これ](http://scrapy-ja.readthedocs.io/ja/latest/topics/selectors.html)。
|
13
|
+
とりあえずreferenceはCSSセレクターなのでscrapyの[これ](http://scrapy-ja.readthedocs.io/ja/latest/topics/selectors.html)。また[scrapyのspiderのも](http://scrapy-ja.readthedocs.io/ja/latest/topics/spiders.html)良いです。
|
14
14
|
|
15
15
|
base URLを取得したいときは
|
16
16
|
|
2
変更
test
CHANGED
@@ -26,7 +26,7 @@
|
|
26
26
|
|
27
27
|
|
28
28
|
|
29
|
-
を指定したやるので、この解釈だと
|
29
|
+
を指定したやるので、この解釈だと「class=js-map-lazyloadの<img>タグのdata-original属性を取得する」ということになります
|
30
30
|
|
31
31
|
|
32
32
|
|
1
追記
test
CHANGED
@@ -30,8 +30,30 @@
|
|
30
30
|
|
31
31
|
|
32
32
|
|
33
|
+
```
|
34
|
+
|
33
|
-
|
35
|
+
response.css('<タグ名>.<クラス名>::attr(<URLの属性>)')
|
36
|
+
|
37
|
+
```
|
34
38
|
|
35
39
|
|
36
40
|
|
37
41
|
という指定でいいかと
|
42
|
+
|
43
|
+
|
44
|
+
|
45
|
+
extract_first()は最初の要素(data-original属性の要素)を取り出します。
|
46
|
+
|
47
|
+
|
48
|
+
|
49
|
+
```
|
50
|
+
|
51
|
+
In [1]: response.css('img.js-map-lazyload::attr("data-original")').extract_first()
|
52
|
+
|
53
|
+
|
54
|
+
|
55
|
+
|
56
|
+
|
57
|
+
Out[1]: 'https://maps.googleapis.com/maps/api/staticmap?client=gme-kakakucominc&channel=tabelog.com&sensor=false&hl=ja¢er=35.729935105434045,139.6771439234143&markers=color:red%7C35.729935105434045,139.6771439234143&zoom=15&size=490x145&signature=VSZ6kU86WFstcOCQz9OYcWo-6EM='
|
58
|
+
|
59
|
+
```
|