【Python】seleniumで複数ページの一つ目しか取得できない。

前提・実現したいこと

前回このサイトで質問したことを踏まえ、seleniumを使ってJavascriptの取得を始めました。
最初は順調にいったのですが、東京メトロの銀座線、丸ノ内線、日比谷線と取得しようとしたときに一番上のページ（この場合だと銀座線）しか取得できない事態がおきました。
ほかに西武鉄道や東武鉄道などはうまくいったので同サイトだからなのか？とも思ったのですが解決法が全く分かりません...

from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
import chromedriver_binary

options = Options()
options.add_argument('--headless')
driver = webdriver.Chrome(options=options)

driver.get('https://www.tokyometro.jp/unkou/history/ginza.html')
html = driver.page_source
soup = BeautifulSoup(html, 'lxml')
text = soup.find(class_='v2_unkouReportInfo').text
print('銀座線:'+text.strip())

driver.get('https://www.tokyometro.jp/unkou/history/marunouchi.html')
html = driver.page_source
soup = BeautifulSoup(html, 'lxml')
text = soup.find(class_='v2_unkouReportInfo').text
print('丸ノ内線:'+text.strip())

driver.get('https://www.tokyometro.jp/unkou/history/hibiya.html')
html = driver.page_source
soup = BeautifulSoup(html, 'lxml')
text = soup.find(class_='v2_unkouReportInfo').text
print('日比谷線:'+text.strip())

driver.quit()

で、結果がこれです。

銀座線:平常運転現在、平常どおり運転しています。
丸ノ内線:
日比谷線:


Process finished with exit code 0

どうやらhtmlがうまく取得できていないみたいなんです。
銀座線


          <div class="v2_unkouReportInfo">
            <div class="v2_unkouReportTxt"><div class="v2_unkouReportTxtHeading"><div class="v2_unkouReportTxtIcon"><img style="" src="/library/common/img/unkou/icon_unkou_heijou.png" alt="" class="v2_unkouReportTxtImg"></div><div class="v2_unkouReportTxtCaption"><p class="">平常運転</p></div></div><p>現在、平常どおり運転しています。</p></div>
          </div>

丸の内線

          <div class="v2_unkouReportInfo">
            <div class="v2_unkouReportTxt">
            </div>
          </div>

なんで同じコードを書いたのに二つ目以降だけ取得できないんですかね...?

行動規範の内容に同意します

回答1件

ベストアンサー

Python
1import time
2driver.get('url')
3time.sleep(5)

とかしても無理ですか？
これで解決するなら、Webdriverwaitで検索して正式な待ちの処理を入れてみてください

投稿2019/11/19 05:11

yamato_user

総合スコア2321

tsukas

2019/11/19 06:24

正常に動きました！ありがとうございます。同じサイトに連続でアクセスする場合、待ちの時間を入れないと正常に動かないということですか？

yamato_user

2019/11/19 06:29

同じサイトというより、ページを移動する際に待ちを入れます。人間がネットサーフィンしてる時もページ遷移するとき時間かかりますよね。それと同じです。

tsukas

2019/11/19 06:36

なるほど、そういうことだったんですね。とてもわかりやすかったです。教えていただきありがとうございました！

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

『🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中！

＼teratail特別グッズやAmazonギフトカード最大2,000円分が当たる！／

【Python】seleniumで複数ページの一つ目しか取得できない。

前提・実現したいこと

関連した質問