Pythonを使いスクレイピングのコードを書いています。
https://www.gucci.com/jp/ja/ca/men/mens-ready-to-wear-c-men-readytowear
このサイトの商品ごとのURLを抽出したいのですが、このページは一度「全てを表示」ボタンを押すことで
全ての商品が表示されます。
また、商品のコンテンツが36個毎に分割されており、下にスクロールしていくと
URLの末尾に数字が付与されていき、URLが変わっていきます。
seleniumを使い、「全てを表示」ボタンを押し、抽出したのですが末尾に「2」が付与されるページまでの情報しか
抽出できませんでした。
何かいい方法はあるでしょうか?
Python
1url = 'https://www.gucci.com/jp/ja/ca/men/mens-ready-to-wear-c-men-readytowear' 2from selenium import webdriver 3browser = webdriver.Chrome("/Users/〜/chromedriver") 4browser.implicitly_wait(10) 5browser.get(url) 6links = browser.find_elements_by_css_selector('.ajax-loader-link-container> a') 7links[0].click() 8new_window = browser.window_handles[0] 9browser.switch_to_window(new_window) 10item_links = browser.find_elements_by_css_selector('a.product-tiles-grid-item-link') 11print(len(item_links))
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。