質問編集履歴

4

文法訂正

2018/10/15 14:47

投稿

yep
yep

スコア45

test CHANGED
File without changes
test CHANGED
@@ -4,7 +4,7 @@
4
4
 
5
5
  もしよろしければ、効率的なスクレイピングの方法をご教授ください。
6
6
 
7
-
7
+ 何卒、よろしくお願いいたします。
8
8
 
9
9
 
10
10
 

3

文法訂正

2018/10/15 14:47

投稿

yep
yep

スコア45

test CHANGED
File without changes
test CHANGED
@@ -1,6 +1,6 @@
1
1
  現代俳句データベースの俳句を取得したいと考えています。
2
2
 
3
- しかしながら、以下のコードでは、複数のページを取得するためには、あまりに一つの季節だけで何百という記載をしなければならなく非効率的になってしまいます。
3
+ しかしながら、以下のコードでは、複数のページを取得するためには、一つの季節だけで何百という記載をしなければならなく非効率的になってしまいます。
4
4
 
5
5
  もしよろしければ、効率的なスクレイピングの方法をご教授ください。
6
6
 

2

文法訂正

2018/10/15 14:20

投稿

yep
yep

スコア45

test CHANGED
File without changes
test CHANGED
@@ -27,6 +27,8 @@
27
27
  import urllib.parse as par
28
28
 
29
29
  import urllib.request as req
30
+
31
+ import time
30
32
 
31
33
 
32
34
 
@@ -72,6 +74,8 @@
72
74
 
73
75
  with req.urlopen(link + par.quote_plus(word)) as response:
74
76
 
77
+ time.sleep(1)
78
+
75
79
  html = response.read().decode('utf-8')
76
80
 
77
81
  all_p_tag = re.findall("<a>.+?</a>", html, re.MULTILINE | re.DOTALL)

1

文法訂正

2018/10/15 14:09

投稿

yep
yep

スコア45

test CHANGED
@@ -1 +1 @@
1
- 複数のページを効率的にスクレイピングしたい
1
+ 複数のページを効率的にスクレイピングしたいです
test CHANGED
File without changes