質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Chrome

Google Chromeは携帯、テレビ、デスクトップなどの様々なプラットフォームで利用できるウェブブラウザです。Googleが開発したもので、Blink (レンダリングエンジン) とアプリケーションフレームワークを使用しています。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

Amazon EC2

Amazon EC2は“Amazon Elastic Compute Cloud”の略称です。Amazon Web Services(AWS)の一部であり、仮想化されたWebサーバーのコンピュータリソースをレンタルできるサービスです。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

Q&A

0回答

1780閲覧

【EC2】seleniumを動かしたとき、アクセスできないURLがある

compan

総合スコア2

Chrome

Google Chromeは携帯、テレビ、デスクトップなどの様々なプラットフォームで利用できるウェブブラウザです。Googleが開発したもので、Blink (レンダリングエンジン) とアプリケーションフレームワークを使用しています。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

Amazon EC2

Amazon EC2は“Amazon Elastic Compute Cloud”の略称です。Amazon Web Services(AWS)の一部であり、仮想化されたWebサーバーのコンピュータリソースをレンタルできるサービスです。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

0グッド

0クリップ

投稿2022/05/02 13:16

前提

EC2上でseleniumを用いて、とあるURLにアクセスを試みるもアクセスできない。
なお、URLに'https://www.yahoo.co.jp/'等を指定すると問題なくアクセスできた。
なお、ローカルでは問題なくアクセスできた。(OSはwindows、webdriverはwindows対応のものに挿げ替え)

実現したいこと

EC2上でseleniumを用いて、とあるURLにアクセスしたい。

発生している問題・エラーメッセージ

selenium.common.exceptions.WebDriverException: Message: unknown error: net::ERR_CONNECTION_REFUSED (Session info: headless chrome=101.0.4951.41)

該当のソースコード

python

1# --------------------------------------------------------------------------------------------------------- 2def conf_chromewebdriver(): 3 # configure Chrome webdriver 4 options = webdriver.ChromeOptions() 5 options.add_experimental_option('excludeSwitches', ['enable-logging']) 6 options.add_argument("start-maximized") 7 options.add_argument("enable-automation") 8 options.add_argument("--headless") 9 options.add_argument("--no-sandbox") 10 options.add_argument("--disable-infobars") 11 options.add_argument('--disable-extensions') 12 options.add_argument("--disable-dev-shm-usage") 13 options.add_argument("--disable-browser-side-navigation") 14 options.add_argument("--disable-gpu") 15 options.add_argument('--ignore-certificate-errors') 16 options.add_argument('--ignore-ssl-errors') 17 prefs = {"profile.default_content_setting_values.notifications": 2} 18 options.add_experimental_option("prefs", prefs) 19 options.use_chromium = True 20 options.headless = True 21 chrome_service = fs.Service( 22 executable_path=webdriver_Chrome_path) 23 driver = webdriver.Chrome( 24 options=options, service=chrome_service) 25 driver.maximize_window() 26 27 return(driver) 28 29 30# --------------------------------------------------------------------------------------------------------- 31 driver = conf_chromewebdriver() 32 33 driver.get(”とあるURL”)    ←ここでエラーとなる。 34# ---------------------------------------------------------------------------------------------------------

試したこと

URLに'https://www.yahoo.co.jp/'等のアドレスを指定 → アクセス成功
EC2上でなくローカルでスクリプトを実施 → アクセス成功

補足情報

chrome: 101.0.4951.41
chromedriver_linux64: 101.0.4951.41
python:3.10.4

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

AbeTakashi

2022/05/02 16:28

単純にEC2からのアクセスを拒絶してるだけではないでしょうか? 海外リージョンのインスタンスを使用しているのなら、単純に海外IPと判断されて遮断されてる可能性はあるかとおもいます。 国内リージョンを使ってるにしても、スクレイピングの対策を入れるなどしている可能性もあるのでは? 主要なクラウドサービスはIPアドレスが公開されていたりします。 他の要因も考えられますが、残念ですが「とあるURL」とだけしか書かれてなく、この質問をみてる第三者も検証ができないので、現状の情報だけではっきりとした回答は出そうにない気がします。
otn

2022/05/03 04:29

EC2上で、wget や curl 等を使ってアクセスできますか? 同様のエラーなら、EC2からはアクセスできないと言うことです。
compan

2022/05/09 07:33 編集

とあるURLですが、ループバックアドレスを指定しております。 EC2上で、wget や curl コマンドを使ってもアクセスできなかったです。。
otn

2022/05/09 12:39

では、そのサイトのアクセスか、EC2を使うことか、どちらかを諦めましょう。
AbeTakashi

2022/05/09 16:22

ループバックアドレス(127.0.0.1?)ということはそのサイトはEC2自身にあるってことですか? wgetでもcurlアクセスできないなら、seleniumも当然無理でしょう。Pythonのスクリプト以前の問題でしょうね。Apacheかnginxかビルドインサーバなのかは分かりませんが、その辺の設定がおかしいのだと思います。もしくは/etc/hostsの設定がおかしいとか。まずはループバックアドレスでwgetなりが成功するところを目指した方がいいです。
compan

2022/05/20 09:10

ご回答ありがとうございます。 nginxがなくなっていたことが原因でした。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問