urlのリンク先をダウンロード

Question

『pythonによるスクレイピング&機械学習』という本の写経をしています。
コードを一通り写経して実行したのですが、ダウンロード失敗に終わってしまい、
エラーメッセージも出ないので、解決方法がわかりません。
ご教授をお願いしたいです。

目的： http://docs.python.jp/3.5/library/先のドキュメントをダウンロードしたい

```python
from bs4 import BeautifulSoup
import requests 
from urllib.parse import urlparse
from os import makedirs
import os.path,time,re

proc_files={}

def enum_links(html,base):
    soup=BeautifulSoup(html,"html.parser")
    links=soup.select("link[rel='stylesheet']")
    links+=soup.select("a[href]")
    result=[]
    
    for a in links:
        href=a.attrs['href']
        url=urljoin(base,href)
        result.append(url)
    return result

def download_file(url):
    o=urlparse(url)
    savepath="./"+o.netloc+o.path
    if re.search(r"/$",savepath):
        savepath+="index.html"
    savedir=os.path.dirname(savepath)
    
    if os.path.exists(savepath):return savepath
    
    if not os.path.exists(savedir):
        print("mkdir=",savedir)
        makedirs(savedir)
        
    try:
        print("download=",url)
        urlretrieve(url,savepath)
        time.sleep(1)
        return savepath
    except:
        print("ダウンロード失敗:",url)
        return None

def analize_html(url,root_url):
    savepath=download_file(url)
    if savepath is None:return
    if savepath in proc_files:return
    proc_files[savepath]=True
    print("analize_html",url)
    
    html=open(savepath,"r",encoding="utf-8").read()
    links=enum_links(html,url)
    
    for link_url in links:
        
        if link_url.find(root_url)!=0:
            if not re.search(r".css$",link_url):continue
                
        if re.search(r".(html|htm)$",link_url):
            analize_html(link_url,root_url)
            continue
            
        download_file(link_url)

if __name__ == "__main__":
    
    url="http://docs.python.jp/3.5/library/"
    analize_html(url,url)
```

実行結果
```
download= http://docs.python.jp/3.5/library/
ダウンロード失敗: http://docs.python.jp/3.5/library/
```

Accepted Answer

2・3行目が違います

```python
from bs4 import BeautifulSoup
from urllib.request import * #ここ
from urllib.parse import * #ここ
```

Answer

```python
    except:
        print("ダウンロード失敗:",url)
        raise  # <- コレ
        return None

```

「コレ」を追加するとエラーが表示されるようになります。

Answer

[読者サポート \| Pythonによるスクレイピング＆機械学習 開発テクニックBeautifulSoup、scikit\-learn、TensorFlowを使ってみよう \| ソシム](http://www.socym.co.jp/support/s-1079)
にてサンプルコードがダウンロードできるようなので見比べてはいかがでしょうか？

関連した質問