回答編集履歴
1
追記
test
CHANGED
@@ -28,7 +28,7 @@
|
|
28
28
|
|
29
29
|
|
30
30
|
|
31
|
-
for i in range(N):
|
31
|
+
for i in range(1, N+1): #元for i in range(N)
|
32
32
|
|
33
33
|
|
34
34
|
|
@@ -40,11 +40,13 @@
|
|
40
40
|
|
41
41
|
url = 'https://search.rakuten.co.jp/search/mall/inz/?p=' + str(i) + '&sid=261213'
|
42
42
|
|
43
|
+
print(url)
|
44
|
+
|
45
|
+
|
46
|
+
|
43
47
|
|
44
48
|
|
45
49
|
html = urllib.request.urlopen(url).read()
|
46
|
-
|
47
|
-
|
48
50
|
|
49
51
|
soup = BeautifulSoup(html, 'lxml')
|
50
52
|
|
@@ -57,3 +59,35 @@
|
|
57
59
|
print(link.attrs['href'])
|
58
60
|
|
59
61
|
```
|
62
|
+
|
63
|
+
|
64
|
+
|
65
|
+
|
66
|
+
|
67
|
+
|
68
|
+
|
69
|
+
### 追記
|
70
|
+
|
71
|
+
同じページばかりを習得してしまうとのことで....
|
72
|
+
|
73
|
+
上記のコードを変更しました.
|
74
|
+
|
75
|
+
この変更により
|
76
|
+
|
77
|
+
**p=1からはじまる**
|
78
|
+
|
79
|
+
**現在のページURLがわかる**
|
80
|
+
|
81
|
+
ようにしました.
|
82
|
+
|
83
|
+
|
84
|
+
|
85
|
+
確認して見ましたがURLが変わるごとに
|
86
|
+
|
87
|
+
e-syugei/xxx/のxxxの数字が違うものが取れて来ているので
|
88
|
+
|
89
|
+
このコードならおそらく違うページが取れるかと.....
|
90
|
+
|
91
|
+
|
92
|
+
|
93
|
+
よろしくおねがいいたします!
|