質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

Q&A

0回答

346閲覧

seleniumでの挙動とブラウザでの挙動が異なり読み込みが終わらない

empnen

総合スコア0

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

0グッド

0クリップ

投稿2023/03/28 06:00

編集2023/03/28 12:20

実現したいこと

  • PythonでSeleniumを利用し、チケット販売サイトにログインを行えるようにする
  • チケットの販売状況を監視し、Restock通知をLINE通知する

前提

Pythonで現在、Seleniumを利用してスクレイピングをしております。
しかしながら、Chromeで当該サイトにアクセスした際の挙動とSelenium経由でアクセスした場合の挙動が異なっておりうまくいかない状況です。
具体的には、リクエストを出したときのレスポンスが帰ってこなかったり
トップ画面のローディングにひたすら時間がかかっている状態となっております。
また、その結果TOP画面に戻ってきた際にログイン状態となっておらず、正しい認証情報にも関わらずログインに失敗しているような挙動です
Chromeでアクセスした際の挙動との差異が出ている原因がわかれば、問題なく動くのではないかと愚考しておりますが
初めてSeleniumを触ることもあり、オプションの部分も調べてみましたが少しお手上げ状態のためご知見を借りられたらと思い投稿しました

発生している問題・エラーメッセージ

Message: timeout: Timed out receiving message from renderer: 299.153 (Session info: chrome=111.0.5563.111)

該当のソースコード

Python

1from selenium import webdriver 2from selenium.webdriver.chrome.options import Options 3from selenium.webdriver.support.select import Select 4from selenium.webdriver.common.by import By 5from selenium.webdriver.common.keys import Keys 6from selenium.webdriver.common.alert import Alert 7from selenium.webdriver.support.ui import WebDriverWait 8from selenium.webdriver.support import expected_conditions as EC 9from selenium.common.exceptions import TimeoutException 10from selenium.webdriver.common.action_chains import ActionChains 11from urllib3.util import wait 12import time 13import requests 14# Seleniumを起動 15options = webdriver.ChromeOptions() 16options.add_argument("start-maximized") 17options.add_argument("enable-automation") 18options.add_argument("--no-sandbox") 19options.add_argument("--disable-infobars") 20options.add_argument('--disable-extensions') 21options.add_argument("--disable-dev-shm-usage") 22options.add_argument("--disable-browser-side-navigation") 23options.add_argument("--disable-gpu") 24options.add_argument('--ignore-certificate-errors') 25options.add_argument('--ignore-ssl-errors') 26prefs = {"profile.default_content_setting_values.notifications" : 2} 27options.add_experimental_option("prefs",prefs) 28 29driver = webdriver.Chrome() 30#Debug中のためTryで囲んでないです 31driver.get("https://plan.tokyodisneyresort.jp/2/?lang=ja&login=true&redirectUrl=%2Fcart%2Fshow%2F%3Flang%3Dja") 32#Frame読み込みまち 33WebDriverWait(driver, 100).until(EC.presence_of_all_elements_located((By.CSS_SELECTOR, "#oneid-iframe"))) 34iframe = driver.find_element(By.CSS_SELECTOR, "#oneid-iframe") 35driver.switch_to.frame(iframe) 36#Submitボタン読み込みまち 37WebDriverWait(driver, 100).until(EC.presence_of_all_elements_located((By.ID,"BtnSubmit"))) 38LoginId = driver.find_element(By.CSS_SELECTOR,"#InputLoginValue") 39LoginId.send_keys("<ID>") 40time.sleep(1) 41password = driver.find_element(By.ID,"InputPassword") 42password.send_keys("<PASSWORD>") 43time.sleep(1) 44driver.find_element(By.ID,"BtnSubmit").click() 45 46#TOPに遷移してくるが、この段階でログイン状態ではない 47#チケット選択へ 48WebDriverWait(driver, 100).until(EC.presence_of_all_elements_located((By.XPATH,"/html/body/div[1]/header/div[2]/div[2]/div[1]/a"))) 49#この後、選択処理記載

試したこと

  • オプションの変更
  • Sleepではなく、WebDriverWaitの利用

補足情報(FW/ツールのバージョンなど)

Pyhtonは3.11

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2023/03/28 11:15

> Chromeで当該サイトにアクセスした際の挙動とSelenium経由でアクセスした場合の挙動が行っており 「挙動が行っており」とは何でしょうか?おそらく挙動が違う、と言いたいのかと思いますが、そのサイトは利用規約などでスクレイピングが禁止されていませんか?サイトがスクレイピング対策を行っている場合、スクレイピングが失敗することがあるようです。
empnen

2023/03/28 12:21

誤字のご指摘ありがとうございます。ご推察の通り、挙動が異なり、と記載したかった部分になります。修正させていただきました。 また、利用規約を確認しましたがスクレイピング禁止などは記載されておらず、暗黙的に対策がされている可能性もあるかと考えております。
Demerara

2023/03/31 08:42

ログイン画面の右下に「reCAPTCHAで保護されています」とありますが、通常の方法でログインした際、何かしらの確認画面が出ませんか?それは、selenium 等の bot をブロックするものなので、ログインに失敗してしまうのだと思います。
empnen

2023/04/01 08:12

記載が足りず失礼しました。 確かにreCAPTCHAなどで引っかかるときもあるのですが、その時は手動でパスさせています。 reCAPTCHAが入るとき、入らないときどちらもありますが、挙動は変わらずブラウザの時は1~2秒で終わる読み込みが全く終わらない。という事象は残り続けている状態です
Demerara

2023/04/03 11:36

上記のコードで成功することもあるし、失敗することもある。 ログインボタンの押下に成功した後は、キャプチャが出ることもあるし、出ないこともある。 出た場合は、手動でパスしている。 キャプチャが出ずにタイムアウト、もしくは手動でパスした後にタイムアウト。 正常に読み込みが終わったとしてもログイン状態になっていない。 という認識で合ってますか? よくわかりませんが、selenium の場合、その reCAPTCH の読み込みを待たずに要素を探してしまうのでタイムアウトしてるんじゃないですか? 最後のチケット選択のコードをコメントアウトして、time.sleep(5) とかして様子を見てみてはどうでしょうか?
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問