質問編集履歴

1

修正

2019/03/21 15:42

投稿

trey_0329
trey_0329

スコア109

test CHANGED
File without changes
test CHANGED
@@ -103,3 +103,35 @@
103
103
 
104
104
 
105
105
  どなたかわかる方いらっしゃいましたらご教示お願い致します。
106
+
107
+
108
+
109
+ また、追加で質問ですが、
110
+
111
+ 今後このサイトのページを一つずつスクレイピングする場合、
112
+
113
+ 各ページのURLは[https://karadarefre.jp/facility/87136/?hold=4](https://karadarefre.jp/facility/87136/?hold=4)
114
+
115
+ のようになり87136の数字の部分を変えていくのだと思いますが、
116
+
117
+ どのように設定すれば良いでしょうか?
118
+
119
+
120
+
121
+ このページ、数字が00001~99999まで順に表示されているわけではなく、
122
+
123
+ 57136
124
+
125
+ 87136
126
+
127
+ 175427
128
+
129
+ など、飛び飛びになっています。
130
+
131
+ 例えばhttps://karadarefre.jp/facility/170000/?hold=3r
132
+
133
+ はページが存在しません。
134
+
135
+ この場合、For Loopで数字を一つずつ足していくのは可能ですが、中にはページがないものも存在します。その場合スクレイピングされないで次の数字に飛びますが、Null値が多くなり無駄な仕事になってしまうと思います。このような場合、どのような考えでスクレイピングすればいいのか理論だけでもいいのでお教え頂いたけますと助かります。
136
+
137
+ よろしくお願い致します。