前提・実現したいこと
「Pythonクローリング&スクレイピング」という本のコードを実際に書き出し、練習しています。
スクレイピングのコードを実行したところ、エラーメッセージは何も出ませんが、何も実行されません。
書き間違いを探しましたが、見つかりませんでした。
**コードの打ち間違い、エラーメッセージもなく、実行だけがされない状況の解決策を教えていただきたいです。
**
該当のソースコード
import requests import lxml.html def main(): session = requests.Session() response = session.get('https://gihyo.jp/dp') urls = scrape_list_page(response) for url in urls: response = session.get(url)#sessionを使って詳細ページを取得する ebook = scrape_detail_page(response)#詳細ページからスクレイピングして電子書籍の情報を得る print(ebook)#電子書籍の情報を表示する break#まず1ページだけで試すため、break文でループを抜ける def scrape_list_page(response): root = lxml.html.fromstring(response.content) root.make_links_absolute(response.url) for a in root.cssselect('#lisstBook a[itemprop="url"]'): url = a.get('href') yield url def scrape_detail_page(response): ''' 詳細ページのResponseから電子書籍の情報をdictで取得する。 ''' root = lxml.html.fromstring(response.content) ebook = { 'url' : response.url, #url 'title' : root.cssselect('#bookTitle')[0].text_content(),#タイトル 'price' : root.cssselect('.buy')[0].text,#価格(.textで直接の子である文字列のみを取得) 'content' : [h3.text_content() for h3 in root.cssselect('#content > h3')],#目次 } return ebook#dictを返す main()
補足情報(FW/ツールのバージョンなど)
テキストエディタはAtom
OSはmacを使用しております。
回答2件
あなたの回答
tips
プレビュー