pythonで以下のコードを実行すると
途中まではaタグ内のURLをちゃんと取得してくれるのですが、
リンク切れのURL(https://kaigobed.net/?pid=32727997)を表示したあと、処理が終了してしまいます。
チェック対象のページ('https://kaigobed.net/?mode=cate&cbid=2642391&csid=0')内の全てのaタグ内のURLを取得したいのですが、どのようにソースを変えればよいでしょうか。
ご教示いただけますと幸いです。
python
1response = session.get('https://kaigobed.net/?mode=cate&cbid=2642391&csid=0') 2 3root = lxml.html.fromstring(response.content) 4root.make_links_absolute(response.url) 5 6for atag in root.cssselect('a[href]'): 7 url = atag.get('href') 8 print(url)
回答1件
あなたの回答
tips
プレビュー