回答編集履歴
1
追記
test
CHANGED
@@ -3,3 +3,35 @@
|
|
3
3
|
requestsやurllib.request、selenium.webdriverなどで取得したソース情報を与える事で
|
4
4
|
|
5
5
|
ソース情報をパースしたり、また任意の要素を抽出したり、ソースの編集を行う事ができるというライブラリです。
|
6
|
+
|
7
|
+
そもそもブラウザが起動したりする事はありません。
|
8
|
+
|
9
|
+
|
10
|
+
|
11
|
+
|
12
|
+
|
13
|
+
```python
|
14
|
+
|
15
|
+
# requestsの場合
|
16
|
+
|
17
|
+
response = requests.get('URL') # requestsでページ情報取得
|
18
|
+
|
19
|
+
soup = BeautifulSoup(res.content, 'html.parser') # 取得したページ情報ソースをパース
|
20
|
+
|
21
|
+
|
22
|
+
|
23
|
+
# webdriverを使用する場合
|
24
|
+
|
25
|
+
html = driver.page_source # webdriver上で現在開いているページのソース取得
|
26
|
+
|
27
|
+
soup = BeautifulSoup(html, 'html.parser') # 取得したソースをパース
|
28
|
+
|
29
|
+
|
30
|
+
|
31
|
+
# ローカルの場合
|
32
|
+
|
33
|
+
file = r'ファイルパス'
|
34
|
+
|
35
|
+
soup = BeautifulSoup(open(file), 'html.parser')
|
36
|
+
|
37
|
+
```
|