質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

Q&A

0回答

832閲覧

PythonのSeleniumでデータをスクレイピングしたいが、読込が永遠に終わらない

p-man1106

総合スコア4

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

0グッド

0クリップ

投稿2021/03/25 05:46

##困っていること

以下の用に、読込のくるくるが、何時間経っても終わりません。

▽くるくるの様子
https://lifework.link/data/rktn_scr.mp4

通常の観覧のブラウザでは読込が一瞬でおわりますが、
Pythonのselenium(chrome driver)では、読込が終わりません。
原因は何でしょうか?

Amazonやその他のサイトでは、読込が終わって処理できます。


##うまく行かない点

楽天アフィリエイトのデータ取得
アカウントへのログイン→レポートページに移動→データ取得
という流れで行っています。

ログインまではうまくいくが、ログイン後のレポートページがいつまで経ってもページの読込が終わらずそこで止まってしまいます。

ページがの読込が終わらない原因はなんでしょうか?
Selniumをつかわず、通常ブラウザで観覧している際は読込はすぐに終わります。


##ソース

  • Python 3.9.1
  • ChromeDriver 87.0.4280.20

python

1rktn_id="xxxxxxx@xxxxxx.jp" 2rktn_pw="xxxxxxx" 3 4rktn_login_page="https://grp02.id.rakuten.co.jp/rms/nid/vc?__event=login&service_id=p11" 5rktn_report_page="https://affiliate.rakuten.co.jp/report/monthly" 6 7Download_dir="/Users/xxxx/Downloads/" 8 9now = datetime.datetime.now() 10d = datetime.timedelta(days=1) 11yesterday=(now-d).strftime("%Y-%m-%d") 12 13 14#### 15 16options = webdriver.ChromeOptions() 17prefs = {'download.default_directory' : Download_dir } 18options.add_experimental_option('prefs',prefs) 19driver_path = '/usr/local/bin/chromedriver' 20browser = webdriver.Chrome(ChromeDriverManager().install(),chrome_options = options) 21 22#### 23 24 25#ログインページ移動 26browser.get(rktn_login_page) 27try: 28 rktn_id_input = browser.find_element_by_css_selector('#loginInner_u') 29 rktn_id_input.send_keys(rktn_id) 30 ##PW入力 31 rktn_pw_input = browser.find_element_by_css_selector('#loginInner_p') 32 rktn_pw_input.send_keys(rktn_pw) 33 ##ログインボタン 34 rktn_login_btn= browser.find_element_by_css_selector('#loginInner > p:nth-child(3) > input') 35 rktn_login_btn.click() 36except: 37 pass 38 39#レポートページ移動 40browser.get(rktn_report_page) 41time.sleep(10) 42 43rktn_datas = browser.find_element_by_css_selector('#monthly_report_table').find_element_by_xpath(("//*[text()=\""+yesterday+"\"]")).find_element_by_xpath("..").find_elements_by_xpath("td") 44 45rktn_rewards=[] 46rktn_clicks=[] 47rktn_counts=[] 48rknt_sales=[] 49 50rktn_rewards.append(rktn_datas[1].text) 51rktn_clicks.append(rktn_datas[2].text) 52rktn_counts.append(rktn_datas[3].text) 53rknt_sales.append(rktn_datas[4].text) 54 55#売上金額表示テスト 56print(rknt_sales[0]) 57

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問