質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Webサイト

一つのドメイン上に存在するWebページの集合体をWebサイトと呼びます。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

Q&A

解決済

1回答

2125閲覧

Pythonでphantomjsの起動がうまく行きません

moseushi_cho

総合スコア11

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Webサイト

一つのドメイン上に存在するWebページの集合体をWebサイトと呼びます。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

0グッド

1クリップ

投稿2018/04/23 14:33

前提・実現したいこと

webスクレイピングでログインページにアクセスし、ログインサイトの情報を取得したい。

発生している問題・エラーメッセージ

jupyterにてwebスクレイピングのコードを試しています。seleniumでphantomjsを使ってログインページからログインし、ログイン後のサイトの情報を取ってこようとしていますが、下記のエラーコードが吐き出されうまく行きません。

WebDriverException: Message: 'phantomjs' executable needs to be in PATH.

コマンドプロンプト上でphantomjs -vコマンドでバージョン情報は表示されるので、phantomjsのインストールには成功していると思います。よろしくお願い致します。

該当のソースコード

Python

1from selenium import webdriver 2browser = webdriver.PhantomJS() 3 4loginUrl= '***' 5browser.get(loginUrl) 6 7username = '***' 8password = '***' 9 10userNameField = browser.find_element_by_xpath('//*[@id="sign_in_session_service_email"]') 11userFameField.send_keys(username) 12 13passwordField = browser.find_element_by_xpath('//*[@id="sign_in_session_service_password"]') 14passwordField.send_keys(password) 15 16submitButton = browser.find_element_by_class_name('//*[@id="login-btn-sumit"]') 17submitButton.click() 18 19browser.title

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

こちらの方法で明示的にパスを指定してみては?

Make the path in raw string, add 'r':

python

driver = webdriver.PhantomJS(executable_path=r'D:\Python\phantomjs-2.0.0-windows\bin\phantomjs.exe')

[python - Selenium/PhantomJS raises error - Stack Overflow](https://stackoverflow.com/questions/29869757/selenium-phantomjs-raises-error)

投稿2018/04/23 14:37

hayataka2049

総合スコア30933

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

moseushi_cho

2018/04/23 15:00

ご回答ありがとうございます。 phantomはCドライブ直下に保存したため、下記のようにすることで解決いたしました。 browser = webdriver.PhantomJS(executable_path=r'C:\phantomjs\bin\phantomjs.exe') Phantomの問題は解決したようですが、webスクレイピングはうまくいってないようで、下記ようなエラーコードが返ってきてしまいました。 InvalidElementStateException Traceback (most recent call last) <ipython-input-5-a00d008809b1> in <module>() 13 passwordField.send_keys(password) 14 ---> 15 submitButton = browser.find_element_by_class_name('//*[@id="login-btn-sumit"]') 16 submitButton.click() 17 ~\Anaconda3\lib\site-packages\selenium\webdriver\remote\webdriver.py in find_element_by_class_name(self, name) 553 element = driver.find_element_by_class_name('foo') 554 """ --> 555 return self.find_element(by=By.CLASS_NAME, value=name) 556 557 def find_elements_by_class_name(self, name): ~\Anaconda3\lib\site-packages\selenium\webdriver\remote\webdriver.py in find_element(self, by, value) 953 return self.execute(Command.FIND_ELEMENT, { 954 'using': by, --> 955 'value': value})['value'] 956 957 def find_elements(self, by=By.ID, value=None): ~\Anaconda3\lib\site-packages\selenium\webdriver\remote\webdriver.py in execute(self, driver_command, params) 310 response = self.command_executor.execute(driver_command, params) 311 if response: --> 312 self.error_handler.check_response(response) 313 response['value'] = self._unwrap_value( 314 response.get('value', None)) ~\Anaconda3\lib\site-packages\selenium\webdriver\remote\errorhandler.py in check_response(self, response) 240 alert_text = value['alert'].get('text') 241 raise exception_class(message, screen, stacktrace, alert_text) --> 242 raise exception_class(message, screen, stacktrace) 243 244 def _value_or_default(self, obj, key, default): InvalidElementStateException: Message: {"errorMessage":"SyntaxError: DOM Exception 12","request":{"headers":{"Accept":"application/json","Accept-Encoding":"identity","Connection":"close","Content-Length":"117","Content-Type":"application/json;charset=UTF-8","Host":"127.0.0.1:49497","User-Agent":"Python http auth"},"httpVersion":"1.1","method":"POST","post":"{\"using\": \"class name\", \"value\": \"//*[@id=\\"login-btn-sumit\\"]\", \"sessionId\": \"1c751090-4706-11e8-86e9-7f53ce626278\"}","url":"/element","urlParsed":{"anchor":"","query":"","file":"element","directory":"/","path":"/element","relative":"/element","port":"","host":"","password":"","user":"","userInfo":"","authority":"","protocol":"","source":"/element","queryKey":{},"chunks":["element"]},"urlOriginal":"/session/1c751090-4706-11e8-86e9-7f53ce626278/element"}} Screenshot: available via screen
hayataka2049

2018/04/23 15:16 編集

そっちのエラーについては、この質問自体の趣旨とずれるのと、一応調べてみてますが私が必ず回答できる自信もないので、改めて質問を立てることをおすすめします。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問