前提・実現したいこと

Seleniumの勉強がてら、Google mapで「ラーメン屋」と検索した結果のスクレイプに挑戦しています。

発生している問題・エラーメッセージ

検索結果一覧から最初の店の詳細まで飛べたのですが、「結果一覧に戻る」ボタンのクリック後、2つ目の店の詳細に飛べません。

Python
1Traceback (most recent call last):
2  File "C:/Users/local/PycharmProjects/Python_programming/google map.py", line 49, in <module>
3    login_button.click()
4  File "C:\Users\local\AppData\Roaming\Python\Python37\site-packages\selenium\webdriver\remote\webelement.py", line 80, in click
5    self._execute(Command.CLICK_ELEMENT)
6  File "C:\Users\local\AppData\Roaming\Python\Python37\site-packages\selenium\webdriver\remote\webelement.py", line 633, in _execute
7    return self._parent.execute(command, params)
8  File "C:\Users\local\AppData\Roaming\Python\Python37\site-packages\selenium\webdriver\remote\webdriver.py", line 321, in execute
9    self.error_handler.check_response(response)
10  File "C:\Users\local\AppData\Roaming\Python\Python37\site-packages\selenium\webdriver\remote\errorhandler.py", line 242, in check_response
11    raise exception_class(message, screen, stacktrace)
12selenium.common.exceptions.StaleElementReferenceException: Message: stale element reference: element is not attached to the page document
13  (Session info: headless chrome=79.0.3945.117)

該当のソースコード

Python
1from selenium import webdriver
2from selenium.webdriver.chrome.options import Options
3from selenium.webdriver.support.ui import WebDriverWait
4from selenium.webdriver.support import expected_conditions as EC
5from selenium.webdriver.common.by import By
6from bs4 import BeautifulSoup
7import time
8import lxml
9
10op = Options()
11op.add_argument("--disable-gpu");
12op.add_argument("--disable-extensions");
13op.add_argument("--proxy-server='direct://'");
14op.add_argument("--proxy-bypass-list=*");
15op.add_argument("--start-maximized");
16op.add_argument("--headless");
17driver = webdriver.Chrome(options=op)
18
19keys = ("ラーメン屋")
20url = 'https://www.google.co.jp/maps/'
21Selector = 'body'
22
23driver.get(url)
24
25WebDriverWait(driver, 30).until(
26    EC.presence_of_element_located((By.CSS_SELECTOR, Selector))
27)
28
29id = driver.find_element_by_id("searchboxinput")
30id.send_keys(keys)
31time.sleep(2)
32
33
34Selector = "//*[@id='searchbox-searchbutton']"
35
36search_button = driver.find_element_by_xpath(Selector)
37search_button.click()
38
39Selector_login = 'section-result'
40WebDriverWait(driver, 30).until(
41        EC.presence_of_element_located((By.CLASS_NAME, Selector_login))
42    )
43time.sleep(1)
44
45login_buttons = driver.find_elements_by_class_name(Selector_login)
46
47for login_button in login_buttons:
48    time.sleep(3)
49    login_button.click()
50
51    Selector = '//*[@id="pane"]/div/div[1]/div/div/div[2]/div[1]/div[1]/h1'
52    WebDriverWait(driver, 30).until(
53        EC.presence_of_element_located((By.XPATH, Selector))
54    )
55
56    page_source = driver.page_source
57    soup = BeautifulSoup(page_source, 'lxml')
58
59    title = soup.find("h1", {"class":"GLOBAL__gm2-headline-5 section-hero-header-title-title"}).text.strip()
60    links = soup.find_all(class_="section-info-text")
61
62    print(title, '\n')
63    for link in links:
64        print(link.text.strip())
65    print('---------------------', '\n')
66
67    Selector_back = '//*[@id="pane"]/div/div[1]/div/div/button'
68    WebDriverWait(driver, 30).until(
69        EC.presence_of_element_located((By.XPATH, Selector_back))
70    )
71    back_button = driver.find_element_by_xpath(Selector_back)
72    back_button.click()
73
74    WebDriverWait(driver, 30).until(
75        EC.presence_of_element_located((By.CLASS_NAME, Selector_login))
76    )
77

試したこと

element is not attached to the page document

とのことなので、

WebDriverWaitで検索結果一覧画面が再表示されるまで待っているのですがうまくいきません。

Google MapのAPIを試しましたが、Google Mapでの検索結果すべてを得られるものではなかったので却下しました。

補足情報（FW/ツールのバージョンなど）

Python 3.7

解決しました！

shiraiさんに教えていただいた方法を試したところ、問題なく動きました。
本当にありがとうございました。

修正したコードは以下の通りです。

Python
1from selenium import webdriver
2from selenium.webdriver.chrome.options import Options
3from selenium.webdriver.support.ui import WebDriverWait
4from selenium.webdriver.support import expected_conditions as EC
5from selenium.webdriver.common.by import By
6from bs4 import BeautifulSoup
7import time
8import lxml
9
10op = Options()
11op.add_argument("--disable-gpu");
12op.add_argument("--disable-extensions");
13op.add_argument("--proxy-server='direct://'");
14op.add_argument("--proxy-bypass-list=*");
15op.add_argument("--start-maximized");
16# op.add_argument("--headless");
17driver = webdriver.Chrome(options=op)
18
19keys = ("ラーメン屋")
20url = 'https://www.google.co.jp/maps/'
21Selector = 'body'
22
23driver.get(url)
24
25WebDriverWait(driver, 30).until(
26    EC.presence_of_element_located((By.CSS_SELECTOR, Selector))
27)
28
29id = driver.find_element_by_id("searchboxinput")
30id.send_keys(keys)
31time.sleep(2)
32
33
34Selector = "//*[@id='searchbox-searchbutton']"
35
36search_button = driver.find_element_by_xpath(Selector)
37search_button.click()
38
39Selector_login = 'section-result'
40WebDriverWait(driver, 30).until(
41        EC.presence_of_element_located((By.CLASS_NAME, Selector_login))
42    )
43time.sleep(1)
44
45for i in range(len(driver.find_elements_by_class_name(Selector_login))):
46    WebDriverWait(driver, 30).until(
47        EC.presence_of_element_located((By.CLASS_NAME, Selector_login))
48    )
49    login_button = driver.find_elements_by_class_name(Selector_login)[i]
50    login_button.click()
51
52    Selector = '//*[@id="pane"]/div/div[1]/div/div/div[2]/div[1]/div[1]/h1'
53    WebDriverWait(driver, 30).until(
54        EC.presence_of_element_located((By.XPATH, Selector))
55    )
56
57    page_source = driver.page_source
58    soup = BeautifulSoup(page_source, 'lxml')
59
60    title = soup.find("h1", {"class":"GLOBAL__gm2-headline-5 section-hero-header-title-title"}).text.strip()
61    links = soup.find_all(class_="section-info-text")
62
63    print(title, '\n')
64    for link in links:
65        print(link.text.strip())
66    print('---------------------', '\n')
67
68    Selector_back = '//*[@id="pane"]/div/div[1]/div/div/button'
69    WebDriverWait(driver, 30).until(
70        EC.presence_of_element_located((By.XPATH, Selector_back))
71    )
72    back_button = driver.find_element_by_xpath(Selector_back)
73    back_button.click()
74
75    WebDriverWait(driver, 30).until(
76        EC.presence_of_element_located((By.CLASS_NAME, Selector_login))
77    )

行動規範の内容に同意します

回答1件

ベストアンサー

StaleElementReferenceExceptionが起こる状況は例えば以下のような状況です。

python
1for hogehoge in driver.find_elements_by_tag_name('input'):
2    hogehoge.click()

for文を宣言した時点でdriver.find_elements_by_tag_name('input')を取得していますが、
for文を回している最中にクリックをしたことによりDOMが変化してしまい、
for文の次の要素を取得しようとした時に、
「さっきまで確かにその要素はあったけど、今はそんな要素は現実のDOMにはないよ」
ということでエラーになります。

SeleniumはちょっとDOMが変化しただけでも
StaleElementReferenceExceptionが起こるものだと思ってください。
ページ遷移なんてもってのほかです。

どうすればいいか

python
1for i in range(len(driver.find_elements_by_tag_name('input'))):
2    hogehoge = driver.find_elements_by_tag_name('input')[i]
3    hogehoge.click()