seleniumでのtableのスクレイピング

前提・実現したいこと

教育現場で使えそうなデータセットを作成すべく、「ナンバース3」の当選番号と当選口数をスクレイピングしています。

発生している問題・エラーメッセージ

http://www.takarakujinet.co.jp/numbers3/index2.html
以上のページでスクレイピングをするために、
①回号を自動入力
②検索から表の要素の抽出
と流れでやったのですが、
table の要素が出てこず、結果として空のリストが返ってきてしまいます。

print(div)
>>>[]

urlが変わらないためurlを変えることもできず大変困っています。
よろしくお願いいたします。

該当のソースコード

python
1import urllib3
2from bs4 import BeautifulSoup
3import certifi
4import re
5import time
6from selenium import webdriver
7import chromedriver_binary
8from selenium.webdriver.support.ui import Select
9kekka = 3000
10driver = webdriver.Chrome()
11driver.get('http://www.takarakujinet.co.jp/numbers3/index2.html')
12time.sleep(3)
13search_box = driver.find_element_by_name("kaigou")
14search_box.send_keys(kekka)
15kaisuu = Select(driver.find_element_by_name("howmany"))
16kaisuu.select_by_value('100')
17driver.find_element_by_id('kaigouRadio').click()
18driver.find_element_by_name('searchbuttom').click()
19page_source = driver.page_source
20soup = BeautifulSoup(page_source, 'html.parser')
21div = soup.find_all('tr',{'class':'even'})
22print(div)
23time.sleep(5)
24driver.quit()

試したこと

今回特定のclassから抽出したいのでこのように書いてありますが、そもそも検索前の表のデータも抽出できません。

補足情報（FW/ツールのバージョンなど）

python 3.7
anaconda 3

行動規範の内容に同意します

回答2件

ジャパンネット銀行で直近１年間のCSVデータダウンロードできます
https://www.japannetbank.co.jp/lottery/analysis/n3.html

投稿2019/07/16 07:52

barobaro

総合スコア1286

検証してみました。
宝くじの表のレンダリングがjavascriptで行われているため、「検索」をクリック後にレンダリングを待つ処理が必要です。

python
1import urllib3
2from bs4 import BeautifulSoup
3import certifi
4import re
5import time
6from selenium import webdriver
7import chromedriver_binary
8from selenium.webdriver.support.ui import Select
9kekka = 3000
10driver = webdriver.Chrome()
11driver.get('http://www.takarakujinet.co.jp/numbers3/index2.html')
12time.sleep(3)
13search_box = driver.find_element_by_name("kaigou")
14search_box.send_keys(kekka)
15kaisuu = Select(driver.find_element_by_name("howmany"))
16kaisuu.select_by_value('100')
17driver.find_element_by_id('kaigouRadio').click()
18driver.find_element_by_name('searchbuttom').click()
19time.sleep(3)
20page_source = driver.page_source
21soup = BeautifulSoup(page_source, 'html.parser')
22div = soup.find_all('tr',{'class':'even'})
23print(div)
24time.sleep(5)
25driver.quit()