質問編集履歴
1
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -103,3 +103,35 @@
|
|
103
103
|
|
104
104
|
|
105
105
|
どなたかわかる方いらっしゃいましたらご教示お願い致します。
|
106
|
+
|
107
|
+
|
108
|
+
|
109
|
+
また、追加で質問ですが、
|
110
|
+
|
111
|
+
今後このサイトのページを一つずつスクレイピングする場合、
|
112
|
+
|
113
|
+
各ページのURLは[https://karadarefre.jp/facility/87136/?hold=4](https://karadarefre.jp/facility/87136/?hold=4)
|
114
|
+
|
115
|
+
のようになり87136の数字の部分を変えていくのだと思いますが、
|
116
|
+
|
117
|
+
どのように設定すれば良いでしょうか?
|
118
|
+
|
119
|
+
|
120
|
+
|
121
|
+
このページ、数字が00001~99999まで順に表示されているわけではなく、
|
122
|
+
|
123
|
+
57136
|
124
|
+
|
125
|
+
87136
|
126
|
+
|
127
|
+
175427
|
128
|
+
|
129
|
+
など、飛び飛びになっています。
|
130
|
+
|
131
|
+
例えばhttps://karadarefre.jp/facility/170000/?hold=3r
|
132
|
+
|
133
|
+
はページが存在しません。
|
134
|
+
|
135
|
+
この場合、For Loopで数字を一つずつ足していくのは可能ですが、中にはページがないものも存在します。その場合スクレイピングされないで次の数字に飛びますが、Null値が多くなり無駄な仕事になってしまうと思います。このような場合、どのような考えでスクレイピングすればいいのか理論だけでもいいのでお教え頂いたけますと助かります。
|
136
|
+
|
137
|
+
よろしくお願い致します。
|