質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
for

for文は、様々なプログラミング言語で使われている制御構造です。for文に定義している条件から外れるまで、for文内の命令文を繰り返し実行します。

if

if文とは様々なプログラミング言語で使用される制御構文の一種であり、条件によって処理の流れを制御します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

Q&A

解決済

1回答

1234閲覧

python.seleniumによるスクレイピングで『次のページ』をfor文とif文で取得する方法について

help-man

総合スコア58

for

for文は、様々なプログラミング言語で使われている制御構造です。for文に定義している条件から外れるまで、for文内の命令文を繰り返し実行します。

if

if文とは様々なプログラミング言語で使用される制御構文の一種であり、条件によって処理の流れを制御します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

0グッド

0クリップ

投稿2021/11/22 09:22

タイトルのとおりです
以下のコードでできません
どこが間違っておりますでしょうか?
何卒ご教授よろしくお願いいたします

python

1a = driver.find_elements_by_xpath('//*[@id="QIKmain_table"]/tbody/tr/td[1]/span') 2b = driver.find_elements_by_xpath('//*[@id="QIKpager"]/ul/li/a') 3 4apple_list = [] 5for i in range(5): 6 apple_list.append(a[i].text) #StaleElementReferenceException(stale element reference: element is not attached to the page document) 7 if len(b)>0: 8 b[i].click() 9 sleep(3)

aはテーブルタグの要素で以下のようにあります
//[@id="QIKmain_table"]/tbody/tr[1]/td[1]/span
//
[@id="QIKmain_table"]/tbody/tr[2]/td[1]/span
//[@id="QIKmain_table"]/tbody/tr[3]/td[1]/span



bは次のページのボタンです
//
[@id="QIKpager"]/ul/li[2]/a
//[@id="QIKpager"]/ul/li[3]/a
//
[@id="QIKpager"]/ul/li[4]/a



一応

python

1if len(b)>0: 2 b[i+2].click() 3 sleep(3)

でやってみましたができませんでした
また、多くのサイトではifではなくwhileとtryを使用しているのですがこのようなプログラムを書くときはwhileとtryのほうが適切なのでしょうか?

参考URL
・selenium 次のページをクリックして最後まで画面推移させたい(https://teratail.com/questions/218274)
・seleniumによるスクレイピングで次ページへのリンクがなくなるまで繰り返し処理をしたい(https://teratail.com/questions/232473)
・「次へ」「次のページへ」「NEXT」をPythonとseleniumでスクレイピングする(https://nanjamonja.net/archives/893)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

StaleElementReferenceException(stale element reference: element is not attached to the page document)

がエラーメッセージですよね?Staleというのは「古くなった」という意味です。

bはAタグのリストなので、b[i].click()はページ遷移が発生します。
ページ遷移すると、それ以前のページの情報は失われるので、abの中に入っているノードは全部無効(=古く)になりますので、参照や操作はできません。

a[i].textをアペンドしつつ、b[i]にページ遷移するというのが、そもそも何をしたいのかが読み取れないので、どうすればいいのかのアドバイスは困難です。

#コメントを受けての追記
こんな感じでしょうか。
ページをめくるたびに、a bを求めないと駄目です。よく考えましょう。

Python

1apple_list = [] 2for i in range(5): 3 a = driver.find_elements_by_xpath('//*[@id="QIKmain_table"]/tbody/tr/td[1]/span') 4 b = driver.find_elements_by_xpath('//*[@id="QIKpager"]/ul/li/a') 5 apple_list.extend([x.text for x in a]) 6 if len(b)>0: 7 b[0].click() 8 sleep(3) 9 else: 10 break

投稿2021/11/22 12:08

編集2021/11/22 14:16
otn

総合スコア84804

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

help-man

2021/11/22 13:22

えっと 1ページ目のaの要素をスクレイピング(1aとする)→次のページを押す(b.click)→2ページ目のaの要素をスクレイピング(2a)→次のページを押す(b.click)→3ページ目のaの要素をスクレイピング(3a)→.....を行い、最終的に1a+2a+3a+4a+5aをしたいです
otn

2021/11/22 13:40

全然わかりません。aもbも1つのページに複数あるのでは? それとも質問文の記述が間違いで、1つのページにaもbも1つずつなんですか?
help-man

2021/11/22 14:03

aはテーブルタグの要素でたくさんあります bは1つです 例えばこのteratail(https://teratail.com/feed/new/1)だと各ユーザーさんの質問がズラーっとあると思います でこの質問欄のすべてのリンクのタイトルをスクレイピングして【次のページ】を押す→2ページ目の質問欄のすべてのリンクのタイトルをスクレイピングをして【次のページ】を押す→3ページ目の質問欄のすべてのリンクのタイトルをスクレイピングをして【次のページ】を押す・・・ を5回したいです これで伝わるといいのですが
otn

2021/11/22 14:06

ああ、やっぱりbは1つなんですね。b[0]~b[4]をアクセスするコードが書かれていたので、5以上あるのかと。 それならわかります。
help-man

2021/11/22 16:08

コメントとコードをご教授くださりありがとうございます やってみましたがなぜか次のページのボタンは押されず1ページ目のテーブルの要素を5回スクレイピングするという不可解なことが起きました しかしご教授いただいたコードを元に色々やってみようと思います ありがとうございました
otn

2021/11/22 16:26

クリックしているリンクが違うんでしょうね。同じページへのリンクをクリックしているということでしょう。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問