ある文字をGoogle検索し、検索した結果がずらーっとページに出ます。
1ページ目の検索結果のタイトルは以下コードで取得できましたが、
2ページ目のどのようにしたら良いか分からず困っております。
※コードは一部省略
resp = web.get('https://www.google.co.jp/search?num=1000&q=' + ' '.join(list_keywd)) resp.raise_for_status() soup = bs4.BeautifulSoup(resp.text, "html.parser") for i in soup.select('.r > a'): y= i.get_text() d1.append(y) x= i.get('href') d2.append(x)
上記で、ページタイトルとURLは取得できます。
ページに「次へ」というタグがあった場合は、次へのページのURLを取得する。
試したこと。
bb = soup.find_all(id='navcnt')
bb = soup.select('#pnnext')
など、divタグやID名、cssセレクタなどで色々と試しましたが、すべて空の結果が返ってきます。
seleniumでリアルタイムに、ページ内のデータを取得し、次へのボタンをクリックしても良いのですが、
今回はrequests、beautiful soupで実行したく思います。
次へのリンク先取得、または次へのタグをクリック
ご教示いただけないでしょうか。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。