回答編集履歴

1

追記

2018/06/23 04:16

投稿

Uzura1994
Uzura1994

スコア17

test CHANGED
@@ -28,7 +28,7 @@
28
28
 
29
29
 
30
30
 
31
- for i in range(N):
31
+ for i in range(1, N+1): #元for i in range(N)
32
32
 
33
33
 
34
34
 
@@ -40,11 +40,13 @@
40
40
 
41
41
  url = 'https://search.rakuten.co.jp/search/mall/inz/?p=' + str(i) + '&sid=261213'
42
42
 
43
+ print(url)
44
+
45
+
46
+
43
47
 
44
48
 
45
49
  html = urllib.request.urlopen(url).read()
46
-
47
-
48
50
 
49
51
  soup = BeautifulSoup(html, 'lxml')
50
52
 
@@ -57,3 +59,35 @@
57
59
  print(link.attrs['href'])
58
60
 
59
61
  ```
62
+
63
+
64
+
65
+
66
+
67
+
68
+
69
+ ### 追記
70
+
71
+ 同じページばかりを習得してしまうとのことで....
72
+
73
+ 上記のコードを変更しました.
74
+
75
+ この変更により
76
+
77
+ **p=1からはじまる**
78
+
79
+ **現在のページURLがわかる**
80
+
81
+ ようにしました.
82
+
83
+
84
+
85
+ 確認して見ましたがURLが変わるごとに
86
+
87
+ e-syugei/xxx/のxxxの数字が違うものが取れて来ているので
88
+
89
+ このコードならおそらく違うページが取れるかと.....
90
+
91
+
92
+
93
+ よろしくおねがいいたします!