Seleniumでのスクレイピング
質問内容は表題の通りです。
Seleniumを用いてあるサイトのスクレイピングをしたく、コードを書いています。
ただ、初心者であるため、誤ってサーバーへのアタックとならないように注意を払いたく、
質問をさせていただきます。
対象となるサイトは、数十ページにわたって、売れ行きのランキングを表示しているサイトです。
やりたい事としては、下記の通りです。
- 1ページ目の最初から商品タイトルを収集してリストに格納
- 終わったら次のページに移動して、上から商品タイトルを収集
- 最後のページまで反復
手順2に関して、一定の待機時間を設けないと、先方のサイトに迷惑をかけてしまうかと思いますので、
待機時間を設ける方法を教えていただけますと幸いです。
既存のページでも色々と調べたのですが、どのようにすればいいのか、判断がつかず、
何卒よろしくお願いします。
該当のソースコード
Python3
1browser = webdriver.Chrome() 2browser.get('https://XXXXXXXXXXXXXXXXXXXXXXXXX_ranking') 3 4service_list = [] 5for i in range(68): 6 elem_contents_data = browser.find_elements_by_class_name('listContentData') 7 for data in elem_contents_data: 8 elem_content_category = data.find_element_by_css_selector('h3') 9 service_list.append(elem_content_category.text) 10 11 pager = browser.find_element_by_class_name('pager') 12 next_button = pager.find_element_by_class_name('next') 13 next_button.click
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/05/20 09:04