質問編集履歴
2
ソースコード編集しました。
title
CHANGED
File without changes
|
body
CHANGED
@@ -30,10 +30,7 @@
|
|
30
30
|
for race_url_list in race_urls:
|
31
31
|
driver.get(race_url_list)
|
32
32
|
html = driver.page_source # ページのソース取得
|
33
|
-
i = i + 1
|
34
|
-
filename = 'England-Premier-League-2018-2019' + str(i) + '.txt'
|
35
|
-
f = open(filename, 'w', encoding='UTF-8') # ファイルを開く(該当ファイルがなければ新規作成)
|
36
|
-
|
33
|
+
print(html)
|
37
34
|
f.close() # ファイルを閉じる
|
38
35
|
driver.close()
|
39
36
|
```
|
1
ソースコードはこちらです。
title
CHANGED
File without changes
|
body
CHANGED
@@ -4,23 +4,15 @@
|
|
4
4
|
|
5
5
|
どのようにすればスクレイピングを行えるでしょうか。python初心者です。すいませんが、よろしくお願いします。```
|
6
6
|
|
7
|
-
|
7
|
+
```ここに言語を入力
|
8
8
|
from selenium import webdriver
|
9
|
-
|
10
9
|
from selenium.webdriver.common.by import By
|
11
|
-
|
12
10
|
from selenium.webdriver.common.keys import Keys
|
13
|
-
|
14
11
|
import xlrd
|
15
|
-
|
16
12
|
import xlwt
|
17
|
-
|
18
13
|
import pprint
|
19
|
-
|
20
14
|
import pandas as pd
|
21
|
-
|
22
15
|
import json
|
23
|
-
|
24
16
|
import sys, io
|
25
17
|
|
26
18
|
sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf-8')
|
@@ -29,36 +21,19 @@
|
|
29
21
|
driver.get('https://www.whoscored.com/Regions/252/Tournaments/2/Seasons/7361/Stages/16368/Fixtures/England-Premier-League-2018-2019')
|
30
22
|
|
31
23
|
race_urls = []
|
32
|
-
|
33
24
|
race_url_list = 0
|
34
|
-
|
35
25
|
i = 0
|
36
|
-
|
37
26
|
elems_race_url = driver.find_elements_by_css_selector('td.result > a')
|
38
|
-
|
39
27
|
for elem_race_url in elems_race_url:
|
40
|
-
|
41
28
|
race_url = elem_race_url.get_attribute('href')
|
42
|
-
|
43
29
|
race_urls.append(race_url)
|
44
|
-
|
45
30
|
for race_url_list in race_urls:
|
46
|
-
|
47
31
|
driver.get(race_url_list)
|
48
|
-
|
49
32
|
html = driver.page_source # ページのソース取得
|
50
|
-
|
51
33
|
i = i + 1
|
52
|
-
|
53
34
|
filename = 'England-Premier-League-2018-2019' + str(i) + '.txt'
|
54
|
-
|
55
35
|
f = open(filename, 'w', encoding='UTF-8') # ファイルを開く(該当ファイルがなければ新規作成)
|
56
|
-
|
57
36
|
f.write(html) # 文字列を記載する
|
58
|
-
|
59
37
|
f.close() # ファイルを閉じる
|
60
|
-
|
61
38
|
driver.close()
|
62
|
-
|
63
|
-
コード
|
64
39
|
```
|