webスクレイピング：検索サイト内での次ページへの遷移

Question

検索サイト（＊規約確認済）内で、情報をスクレイピングしたいのですが、調べながら作成した以下のコードでは次ページの情報まで取得できません。(10/17 21:48)コードを再度改めてみましたが、エラーは出なくなりましたが、ページ遷移しません。中身も取れていません。

(10/10 23:38)
listにテキスト抽出を命じていたので、ページ遷移箇所を書き直したら今度はプログラムが終わりません。 
どうぞ宜しくお願いします。
```python　10/17編集済み
import time
from selenium import webdriver
driver=webdriver.Chrome()

driver.get('https://www.mrso.jp/searches/?redirect&view=plan')

def search(driver):
    i = 1               # ループ番号、ページ番号を定義
    i_max = 5           # 最大何ページまで分析するかを定義
    courses_list=[]
    facili_list=[]
    price_list=[]
    link_list=[]
    next_list=[]

    # 現在のページが指定した最大分析ページを超えるまでループする
    while i <= i_max:
        class_group =driver.find_elements_by_class_name('page-search__wrap.facility')
        # タイトルとリンクを抽出しリストに追加するforループ
        for elem in  class_group:
            courses_list.append(elem.find_element_by_class_name('-name').text)
        for elem in  class_group:
            facili_list.append(elem.find_element_by_class_name('-facility-name').text)
        for elem in  class_group:
            price_list.append(elem.find_element_by_class_name('-price').text)
        for elem in  class_group:
            link_list.append(elem.find_element_by_class_name('-link').get_attribute('href'))
    
        # 「次へ」は1つしかないが、あえてelementsで複数検索。空のリストであれば最終ページの意味になる。
        for elem in  class_group:
            next_list=elem.find_elements_by_class_name('-item -next')
        if next_list==[]:
            i = i_max + 1
        else:
            next_list.click()
            i = i + 1               # iを更新
            time.sleep(3)           # 3秒間待機
    return courses_list,facili_list, price_list,link_list    # タイトルとリンクのリストを戻り値に指定

courses_list,facili_list,price_list,link_list=search(driver)


```

Accepted Answer

間違いとまでは言いませんが`class_group`の定義の仕方が少しおかしいです。
どうがんばっても指定の要素は1つしかない為、elementsとする必要がないです。
またそれが原因でページ内のデータも冒頭の1個しか取得出来ていない様です。
(リストになってしまっている為)

この場合であれば`find_element_by_class_name('page-search__list')`と指定し
もう少し細かく対象を絞った方が抽出も楽で、これでページ内の全ての情報が取得できます。

ページ遷移の次ページの抽出についても特に`class_group`から抽出する必要性は特になさそうでdriver変数から取ったほうが良さそうです。

```python
def search(driver):
	i = 1			   # ループ番号、ページ番号を定義
	i_max = 5		   # 最大何ページまで分析するかを定義
	courses_list=[]
	facili_list=[]
	price_list=[]
	link_list=[]

	# 現在のページが指定した最大分析ページを超えるまでループする
	while i <= i_max:
		class_group =driver.find_element_by_class_name('page-search__list')
		courses_list.append([elem.text for elem in  class_group.find_elements_by_class_name('-name')])
		facili_list.append([elem.text for elem in class_group.find_elements_by_class_name('-facility-name')])
		price_list.append([elem.text for elem in class_group.find_elements_by_class_name('-price')])
		link_list.append([elem.get_attribute('href') for elem in class_group.find_elements_by_class_name('-link')])


		next_list = driver.find_element_by_class_name('-next').click()
		i += 1
		time.sleep(3)		   # 3秒間待機
		

	return courses_list,facili_list, price_list,link_list	# タイトルとリンクのリストを戻り値に指定

courses_list,facili_list,price_list,link_list=search(driver)
```

### 備考
抽出しているlinkについてですが、各データに対し`class="-link"`が付与された要素が3つずつある様なので
抽出の仕方を変えるか、重複した場合の対処を行ったほうが良さそうです。

### 追記
コードをよく見ていたら、ページ遷移の際の次ページがなかった場合の処理をわすれていた為
関数内のnext_list部分を以下の様に変更してあげてください。
```python
		try:
			next_list = driver.find_element_by_class_name('-next').click()
			i += 1
			time.sleep(3)		# 3秒間待機
		except:
			break


	return courses_list,facili_list, price_list,link_list	# タイトルとリンクのリストを戻り値に指定
```

Answer

> 11 class_group =driver.find_elements_by_class_name('page-search__wrap facility')

で、

> invalid selector: Compound class names not permitted

というエラーなので、
`class_group =driver.find_elements_by_class_name('page-search__wrap.facility')`
でしょうか。

複数クラス名を指定する場合は、`.`で繋ぐようです。

備考

追記

関連した質問