質問編集履歴

1

修正

2020/08/14 17:28

投稿

logos
logos

スコア7

test CHANGED
@@ -1 +1 @@
1
- プロキシ(proxy)経由のスクレイピングでhtml構造を取得できない
1
+ プロキシ(proxy)経由のスクレイピング(Selenium&Chrome)でhtml構造を取得できない
test CHANGED
@@ -10,11 +10,11 @@
10
10
 
11
11
  ### 発生している問題・エラーメッセージ
12
12
 
13
- 通常のネットワークではうまく動作しています。
14
-
15
- しかし、プロキシを経由するとhtml構造が読み取れなくなります。
13
+ 通常のネットワークではうまく動作ています。しかし、プロキシを経由して実行すると、ウェブサイトは表示されるもののhtml構造が読み取れなくなります。
14
+
16
-
15
+ ウエブサイトは手動で操作ができるうえ、開発者ツールで見ても通常のネットワークの要素と相違はありません。
16
+
17
- 原因として,「BeautifulSoup(html,"html.parser")」でオプションの記述等が不足しているのではないかと疑っています。
17
+ 原因として「BeautifulSoup(html,"html.parser")」でオプションの記述等が不足しているのではないかと疑っています。
18
18
 
19
19
 
20
20
 
@@ -26,11 +26,11 @@
26
26
 
27
27
  ### 使用している言語・ブラウザ等
28
28
 
29
- python3.6
29
+ python3.6,
30
-
30
+
31
- Chrome
31
+ Chrome,
32
-
32
+
33
- Selenium
33
+ Selenium,
34
34
 
35
35
  luminati(レンタルプロキシ)
36
36
 
@@ -60,7 +60,7 @@
60
60
 
61
61
  import pyautogui
62
62
 
63
- #プロキシ認証lum-customer-hiroshi_nakatan-zone-static5grvlrjmwltdlum-customer-hiroshi_nakatan-zone-static5grvlrjmwltd
63
+ #プロキシ認証
64
64
 
65
65
  from selenium.webdriver.common.proxy import Proxy, ProxyType
66
66