回答編集履歴

1

追記

2020/11/17 03:00

投稿

nto
nto

スコア1438

test CHANGED
@@ -3,3 +3,35 @@
3
3
  requestsやurllib.request、selenium.webdriverなどで取得したソース情報を与える事で
4
4
 
5
5
  ソース情報をパースしたり、また任意の要素を抽出したり、ソースの編集を行う事ができるというライブラリです。
6
+
7
+ そもそもブラウザが起動したりする事はありません。
8
+
9
+
10
+
11
+
12
+
13
+ ```python
14
+
15
+ # requestsの場合
16
+
17
+ response = requests.get('URL') # requestsでページ情報取得
18
+
19
+ soup = BeautifulSoup(res.content, 'html.parser') # 取得したページ情報ソースをパース
20
+
21
+
22
+
23
+ # webdriverを使用する場合
24
+
25
+ html = driver.page_source # webdriver上で現在開いているページのソース取得
26
+
27
+ soup = BeautifulSoup(html, 'html.parser') # 取得したソースをパース
28
+
29
+
30
+
31
+ # ローカルの場合
32
+
33
+ file = r'ファイルパス'
34
+
35
+ soup = BeautifulSoup(open(file), 'html.parser')
36
+
37
+ ```