[Python]ページネーションのスクレイピングについて

前提・実現したいこと

python初心者です。スクレイピングについて教えてください。

・1ページの中で取得したいものは取得できた
・ページネーション分すべてスクレイピングしたい

質問も始めてで不備があるかと思いますが何卒宜しくお願い致します。

該当のソースコード

coding: UTF-8
import urllib.request, urllib.error
html = urllib.request.urlopen('https://search.rakuten.co.jp/search/mall/inz/?p=2&sid=261213').read()
from bs4 import BeautifulSoup

soup = BeautifulSoup(html, 'lxml')
div = soup.findAll('div' , class_='image')
for f in div:
for link in f.findAll('a'):
print(link.attrs['href'])

補足情報（FW/ツールのバージョンなど）

https://search.rakuten.co.jp/search/mall/inz/?p=2&sid=261213

このURLの中の「P=〇」が30弱まであるのですが、最後まで取得したいです。

行動規範の内容に同意します

回答1件

ベストアンサー

はじめまして．
質問者様の意図は以下のようなことでしょうか？

p＝⚪︎の値をfor文で変更することでページネートを変えてます．
自分の環境ではこれで回ったはず？です！

Python
1import urllib.request, urllib.error
2from bs4 import BeautifulSoup
3from time import sleep
4
5if __name__ == '__main__':
6    N = 30 #ページネートの数
7    BT = 2
8
9    for i in range(1, N+1): #元for i in range(N)
10
11        sleep(BT)#アクセスが多くなりすぎないように時間を開ける
12
13        #pの値をfor文で変える
14        url = 'https://search.rakuten.co.jp/search/mall/inz/?p=' + str(i) + '&sid=261213'
15        print(url)
16
17
18        html = urllib.request.urlopen(url).read()
19        soup = BeautifulSoup(html, 'lxml')
20        div = soup.findAll('div' , class_='image')
21        for f in div:
22            for link in f.findAll('a'):
23                print(link.attrs['href'])