ヤマト運輸の集配拠点のデータを取ってくるために、ヤマト運輸のHPのクローリングを行いたいです。
例えば、東京都足立区のページ(https://www.e-map.ne.jp/p/yamato01/nmap.htm?&cond22=1&&&his=al1%2Cal2&lat=35.7724056&lon=139.8077417&srchnm=%C5%EC%B5%FE%C5%D4%C2%AD%CE%A9%B6%E8)からセブンイレブン足立梅島2丁目 (https://www.e-map.ne.jp/p/yamato01/dtl/0338480711/?&cond21=1&cond22=1&&his=al1,al2,nm&srchplace=35.7724056,139.8077417)のデータを取ってくるということをしたいです…①
①のような操作を23区のすべての集配拠点について行いたいのですが、①の操作ができないでいます。
①の操作のために用いているメソッドは以下の通りです。
python
1def get_dtl_Link(url): # 受け取ったurl先のリンクを取得 2 res = requests.get(url) 3 soup = bs(res.content, "html.parser") 4 return soup.find_all("a",href=re.compile("^dtl"))
ここで、東京都足立区の場合、
python
1url=https://www.e-map.ne.jp/p/yamato01/nmap.htm?&cond22=1&&&his=al1%2Cal2&lat=35.7724056&lon=139.8077417&srchnm=%C5%EC%B5%FE%C5%D4%C2%AD%CE%A9%B6%E8
です。
しかし、これでは各店舗の詳細ページを取ってくることができません。エラーも出ません。どうすればよいのでしょうか。お知恵を拝借できれば幸いです。
追記1
以下のように、"^dtl"を"dtl"としたメソッドでもうまくいきません。
python
1def get_dtl_Link(url): # 受け取ったurl先のリンクを取得 2 res = requests.get(url) 3 soup = bs(res.content, "html.parser") 4 return soup.find_all("a",href=re.compile("dtl"))