回答編集履歴

urllib\.requestの説明の追加と、「パーサー」を明記しました。

2016/07/24 10:36

投稿

スコア9398

answer CHANGED Viewed

@@ -1,6 +1,8 @@
 単にスクレイピングができれば良いのでしたら、
 `lxml.html`と`cssselect`を使うよりも、
-最近は**BeautifulSoup**というモジュールの方が人気があるので、そちらを使った方が良いかもしれません。
+最近は**BeautifulSoup**というパーサーモジュールの方が人気があるので、そちらを使った方が良いかもしれません。
+HTMLを取得する処理は、標準モジュールの`urllib.request`モジュールにします。
+これらを組み合わせて使います。
 Windows7(64bit), Python3.5.2+Anaconda4.1.1で確認しましたが、上手く本文の`<p>`タグが取れました。