teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

2

実行コードの編集

2018/02/13 08:01

投稿

pockygame
pockygame

スコア17

title CHANGED
File without changes
body CHANGED
@@ -6,17 +6,12 @@
6
6
  from selenium import webdriver
7
7
  browser = webdriver.PhantomJS(executable_path="/usr/bin/phantomjs")
8
8
 
9
- browser.get("https://kitty.appx.hk/100/101/0")
9
+ browser.get("該当サイト")
10
10
  browser.implicitly_wait(10)
11
11
  time.sleep(10)
12
12
  html = browser.page_source.encode('utf-8')
13
13
  print(html)
14
14
  ```
15
15
 
16
- 取得出来るページのソースコード(Javascript実行前のもの)
17
- ```html
18
- <!DOCTYPE html><html lang="en"><head><meta charset="utf-8"><meta name="viewport" content="width=device-width,initial-scale=1,shrink-to-fit=no"><meta name="theme-color" content="#000000"><link rel="manifest" href="/manifest.json"><link rel="shortcut icon" href="/favicon.png"><title>AppX CryptoKitties</title><link href="/static/css/main.54020614.css" rel="stylesheet"></head><body><noscript>You need to enable JavaScript to run this app.</noscript><div id="root"></div><script type="text/javascript" async="" src="https://www.google-analytics.com/analytics.js"></script><script async="" src="https://www.googletagmanager.com/gtag/js?id=UA-73311457-11"></script><script>window.dataLayer=window.dataLayer||[];function gtag(){dataLayer.push(arguments)}gtag("js",new Date),gtag("config","UA-73311457-11")</script><script type="text/javascript" src="/static/js/main.8f7225a1.js"></script></body></html>
19
- ```
20
-
21
16
  他のドライバーやブラウザを使うといった解決策も含め、どなたかお分かりの方がいらっしゃればご教授いただけますと助かります。
22
17
  よろしくお願い致します。

1

ソースコードの追加

2018/02/13 08:01

投稿

pockygame
pockygame

スコア17

title CHANGED
File without changes
body CHANGED
@@ -1,7 +1,22 @@
1
1
  PythonでJavascriptの動作しているページからスクレイピングするコードを書いています。
2
2
 
3
3
  Selenium,PhantomJSの組み合わせでページを取得しようとしているのですが、Javascriptが有効になっていない状態のページを取得してしまいます。
4
- ※通常のスクレイピングは正しく行え、また特定のサイトだけでなくJavascriptの入っているページでは同様に有効になっていない状態で取得してしまいます。
5
4
 
5
+ ```Python
6
+ from selenium import webdriver
7
+ browser = webdriver.PhantomJS(executable_path="/usr/bin/phantomjs")
8
+
9
+ browser.get("https://kitty.appx.hk/100/101/0")
10
+ browser.implicitly_wait(10)
11
+ time.sleep(10)
12
+ html = browser.page_source.encode('utf-8')
13
+ print(html)
14
+ ```
15
+
16
+ 取得出来るページのソースコード(Javascript実行前のもの)
17
+ ```html
18
+ <!DOCTYPE html><html lang="en"><head><meta charset="utf-8"><meta name="viewport" content="width=device-width,initial-scale=1,shrink-to-fit=no"><meta name="theme-color" content="#000000"><link rel="manifest" href="/manifest.json"><link rel="shortcut icon" href="/favicon.png"><title>AppX CryptoKitties</title><link href="/static/css/main.54020614.css" rel="stylesheet"></head><body><noscript>You need to enable JavaScript to run this app.</noscript><div id="root"></div><script type="text/javascript" async="" src="https://www.google-analytics.com/analytics.js"></script><script async="" src="https://www.googletagmanager.com/gtag/js?id=UA-73311457-11"></script><script>window.dataLayer=window.dataLayer||[];function gtag(){dataLayer.push(arguments)}gtag("js",new Date),gtag("config","UA-73311457-11")</script><script type="text/javascript" src="/static/js/main.8f7225a1.js"></script></body></html>
19
+ ```
20
+
6
21
  他のドライバーやブラウザを使うといった解決策も含め、どなたかお分かりの方がいらっしゃればご教授いただけますと助かります。
7
22
  よろしくお願い致します。