質問編集履歴

2

実行コードの編集

2018/02/13 08:01

投稿

pockygame
pockygame

スコア17

test CHANGED
File without changes
test CHANGED
@@ -14,7 +14,7 @@
14
14
 
15
15
 
16
16
 
17
- browser.get("https://kitty.appx.hk/100/101/0")
17
+ browser.get("該当サイト")
18
18
 
19
19
  browser.implicitly_wait(10)
20
20
 
@@ -28,16 +28,6 @@
28
28
 
29
29
 
30
30
 
31
- 取得出来るページのソースコード(Javascript実行前のもの)
32
-
33
- ```html
34
-
35
- <!DOCTYPE html><html lang="en"><head><meta charset="utf-8"><meta name="viewport" content="width=device-width,initial-scale=1,shrink-to-fit=no"><meta name="theme-color" content="#000000"><link rel="manifest" href="/manifest.json"><link rel="shortcut icon" href="/favicon.png"><title>AppX CryptoKitties</title><link href="/static/css/main.54020614.css" rel="stylesheet"></head><body><noscript>You need to enable JavaScript to run this app.</noscript><div id="root"></div><script type="text/javascript" async="" src="https://www.google-analytics.com/analytics.js"></script><script async="" src="https://www.googletagmanager.com/gtag/js?id=UA-73311457-11"></script><script>window.dataLayer=window.dataLayer||[];function gtag(){dataLayer.push(arguments)}gtag("js",new Date),gtag("config","UA-73311457-11")</script><script type="text/javascript" src="/static/js/main.8f7225a1.js"></script></body></html>
36
-
37
- ```
38
-
39
-
40
-
41
31
  他のドライバーやブラウザを使うといった解決策も含め、どなたかお分かりの方がいらっしゃればご教授いただけますと助かります。
42
32
 
43
33
  よろしくお願い致します。

1

ソースコードの追加

2018/02/13 08:01

投稿

pockygame
pockygame

スコア17

test CHANGED
File without changes
test CHANGED
@@ -4,7 +4,37 @@
4
4
 
5
5
  Selenium,PhantomJSの組み合わせでページを取得しようとしているのですが、Javascriptが有効になっていない状態のページを取得してしまいます。
6
6
 
7
- ※通常のスクレイピングは正しく行え、また特定のサイトだけでなくJavascriptの入っているページでは同様に有効になっていない状態で取得してしまいます。
7
+
8
+
9
+ ```Python
10
+
11
+ from selenium import webdriver
12
+
13
+ browser = webdriver.PhantomJS(executable_path="/usr/bin/phantomjs")
14
+
15
+
16
+
17
+ browser.get("https://kitty.appx.hk/100/101/0")
18
+
19
+ browser.implicitly_wait(10)
20
+
21
+ time.sleep(10)
22
+
23
+ html = browser.page_source.encode('utf-8')
24
+
25
+ print(html)
26
+
27
+ ```
28
+
29
+
30
+
31
+ 取得出来るページのソースコード(Javascript実行前のもの)
32
+
33
+ ```html
34
+
35
+ <!DOCTYPE html><html lang="en"><head><meta charset="utf-8"><meta name="viewport" content="width=device-width,initial-scale=1,shrink-to-fit=no"><meta name="theme-color" content="#000000"><link rel="manifest" href="/manifest.json"><link rel="shortcut icon" href="/favicon.png"><title>AppX CryptoKitties</title><link href="/static/css/main.54020614.css" rel="stylesheet"></head><body><noscript>You need to enable JavaScript to run this app.</noscript><div id="root"></div><script type="text/javascript" async="" src="https://www.google-analytics.com/analytics.js"></script><script async="" src="https://www.googletagmanager.com/gtag/js?id=UA-73311457-11"></script><script>window.dataLayer=window.dataLayer||[];function gtag(){dataLayer.push(arguments)}gtag("js",new Date),gtag("config","UA-73311457-11")</script><script type="text/javascript" src="/static/js/main.8f7225a1.js"></script></body></html>
36
+
37
+ ```
8
38
 
9
39
 
10
40