teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

2

ソースコード編集しました。

2020/02/04 14:00

投稿

退会済みユーザー
title CHANGED
File without changes
body CHANGED
@@ -30,10 +30,7 @@
30
30
  for race_url_list in race_urls:
31
31
  driver.get(race_url_list)
32
32
  html = driver.page_source # ページのソース取得
33
- i = i + 1
34
- filename = 'England-Premier-League-2018-2019' + str(i) + '.txt'
35
- f = open(filename, 'w', encoding='UTF-8') # ファイルを開く(該当ファイルがなければ新規作成)
36
- f.write(html) # 文字列を記載する
33
+ print(html)
37
34
  f.close() # ファイルを閉じる
38
35
  driver.close()
39
36
  ```

1

ソースコードはこちらです。

2020/02/04 14:00

投稿

退会済みユーザー
title CHANGED
File without changes
body CHANGED
@@ -4,23 +4,15 @@
4
4
 
5
5
  どのようにすればスクレイピングを行えるでしょうか。python初心者です。すいませんが、よろしくお願いします。```
6
6
 
7
-
7
+ ```ここに言語を入力
8
8
  from selenium import webdriver
9
-
10
9
  from selenium.webdriver.common.by import By
11
-
12
10
  from selenium.webdriver.common.keys import Keys
13
-
14
11
  import xlrd
15
-
16
12
  import xlwt
17
-
18
13
  import pprint
19
-
20
14
  import pandas as pd
21
-
22
15
  import json
23
-
24
16
  import sys, io
25
17
 
26
18
  sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf-8')
@@ -29,36 +21,19 @@
29
21
  driver.get('https://www.whoscored.com/Regions/252/Tournaments/2/Seasons/7361/Stages/16368/Fixtures/England-Premier-League-2018-2019')
30
22
 
31
23
  race_urls = []
32
-
33
24
  race_url_list = 0
34
-
35
25
  i = 0
36
-
37
26
  elems_race_url = driver.find_elements_by_css_selector('td.result > a')
38
-
39
27
  for elem_race_url in elems_race_url:
40
-
41
28
  race_url = elem_race_url.get_attribute('href')
42
-
43
29
  race_urls.append(race_url)
44
-
45
30
  for race_url_list in race_urls:
46
-
47
31
  driver.get(race_url_list)
48
-
49
32
  html = driver.page_source # ページのソース取得
50
-
51
33
  i = i + 1
52
-
53
34
  filename = 'England-Premier-League-2018-2019' + str(i) + '.txt'
54
-
55
35
  f = open(filename, 'w', encoding='UTF-8') # ファイルを開く(該当ファイルがなければ新規作成)
56
-
57
36
  f.write(html) # 文字列を記載する
58
-
59
37
  f.close() # ファイルを閉じる
60
-
61
38
  driver.close()
62
-
63
- コード
64
39
  ```