質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%

Q&A

解決済

2回答

3269閲覧

スクレイピングでのスクロールの操作

tetsuya7724

総合スコア67

0グッド

0クリップ

投稿2022/06/22 05:44

編集2022/06/22 06:00

前提

Google Mapのスクレイピングに挑戦しているのですが、画面のスクロールで詰まっています。
行ってみたいリストの表示画面をスクロールするのを自動化したいです。

seleniumを使っているのですが、XPATH を指定してもスクロールをしてくれません。

下までスクロールをして、子要素をすべて表示して店の名前をすべて取得することが目的です。

指定するXPATHが間違っているのでしょうか?ご教授のほどよろしくお願いします。

赤枠で囲ったところがスクロールしたい部分です。

イメージ説明

該当のソースコード

python

1# -*- coding: utf-8 -*- 2""" 3Created on Fri Mar 18 14:19:17 2022 4指定したブラウザは完全に止めてから起動する 5@author: Noriyuki Crypto 6""" 7 8import random 9import sys 10import time 11 12from selenium import webdriver 13from selenium.webdriver.chrome import service as fs 14from selenium.webdriver.common.by import By 15from selenium.webdriver.common.keys import Keys 16 17# ドライバーの設定 18def driver_settting(): 19 driver_path = "C:\\Users\\008D42\\Documents\\chromedriver.exe" 20 brave_path = "C:\\Program Files\\BraveSoftware\\Brave-Browser\\Application\\brave.exe" 21 22 size_w = 1000 #ウィンド幅 23 size_h = 1000 #ウィンド高 24 25 options = webdriver.ChromeOptions() 26 options.add_experimental_option("excludeSwitches", ["enable-logging"]) #GettingDefaultAdapterfailedのエラーメッセージをなくす 27 options.add_argument('--user-data-dir=C:\\Users\\008D42\\AppData\\Local\\BraveSoftware\\Brave-Browser\\User Data') 28 options.add_argument('--profile-directory=Default') #プロパティパスの設定 29 options.add_argument('--lang=jp') 30 31 options.binary_location = brave_path 32 chrome_service = fs.Service(executable_path=driver_path) 33 brave = webdriver.Chrome(service=chrome_service, options=options) 34 brave.set_window_size(size_w,size_h) 35 36 return brave 37 38# メイン 39def main(): 40 site = "https://www.google.co.jp/maps/@35.6734257,139.7772929,13z/data=!4m3!11m2!2sNxRKAx0R-fi7YvXPdRXtiDoCXrmo6w!3e2?hl=ja" 41 42 # ドライバーの設定を決定する 43 driver = driver_settting() 44 brave = driver 45 46 dispwait = 20 #表示待ち時間(秒) 47 # sleeptime = 2 #表示中時間(秒) 48 sleeptime = random.uniform(1, 5) 49 50 #サイト表示 51 brave.get(site) 52 53 # 表示待機 54 brave.implicitly_wait(dispwait) 55 # 表示状態 56 time.sleep(sleeptime) 57 58 element = brave.find_element(by=By.XPATH, value='/html/body/div[3]/div[9]/div[9]/div/div/div[1]/div[2]/div/div[1]/div/div/div[2]') 59 print(element) 60 61 element.location_once_scrolled_into_view 62 63 print("yes") 64 65if __name__ == "__main__": 66 main() 67

試したこと

スクロールしたい範囲のclassが"m6QErb DxyBCb kA9KIf dS8AEf" だったので、下記のものを試しましたが動きませんでした。
driver.execute_script(“window.scrollTo(0, document.getElementByClassName('m6QErb DxyBCb kA9KIf dS8AEf').scrollHeight)“)

補足情報(FW/ツールのバージョンなど)

ここにより詳細な情報を記載してください。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Matsumon0104

2022/06/22 07:05

コードを読み込んでいませんでしたが、編集後にgoogle mapsの画像が張られており、一点懸念事項がございます。 Google Mapsは外部からのスクレイピングを禁止しているようです。 https://cloud.google.com/maps-platform/terms?_ga=2.219471129.103809388.1611700969-418788476.1611700969&_gac=1.53442266.1611701016.Cj0KCQiAmL-ABhDFARIsAKywVafwa6UWzmjEUfkB8rEj- Google Mapsの情報を利用したい場合は、専用のAPIがありますので、そちらを利用した方がよいかとおもいます。 https://www.zenrin-datacom.net/solution/gmapsapi?fm_cp=6285a1b77c39d94483a09e03&fm_mu=6285a1e5e4dd402f643a8891&utm_campaign=6285a1b77c39d94483a09e03&utm_medium=cpc&utm_source=google&gclid=CjwKCAjw-8qVBhANEiwAfjXLru6IB5oMUQYtau7GAof625UVR-uH9AcFkTvZecWHIf2kmV1XAiykzxoCM6oQAvD_BwE
guest

回答2

0

自己解決

for i in range(0, 10): driver.execute_script("arguments[0].scrollTop = arguments[0].scrollHeight", element) time.sleep(1)

上記のように書くことでできました。
ヒントありがとうございます。

投稿2022/06/22 06:54

tetsuya7724

総合スコア67

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

driverでjavascriptでスクロール処理を実行してください。

python

1driver.execute_script(“ここに実行したいスクリプトを入力“)

実際にスクロール処理のサンプルがある参考ページ
seleniumで用意されているexecute_scriptの用途

投稿2022/06/22 05:58

Matsumon0104

総合スコア1005

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問