前提・実現したいこと
厚生労働省の介護サービス情報公表システムを使って,介護事業所の情報を条件を設定してスクレイピングしたいと考えています。しかしながら、条件を設定して検索しても、urlが変わらないため、スクレイピングができずに困っています。(http://www.kaigokensaku.mhlw.go.jp/27/index.php?action_kouhyou_pref_search_list_list=true&PrefCd=27)
次のページを示すところの要素を見ると、href = javascript:void(0); となっており、ページを帰ることができません。
どのようにすればページを切り替えることができるのでしょうか。
似たような質問(https://teratail.com/questions/128962)をみて、今回はjavascriptで覆われているためどう解明すればいいのかわかりません。
また、こちらの事業所検索ページ(http://www.kaigokensaku.mhlw.go.jp/27/index.php?action_kouhyou_pref_search_keyword_search=true) で条件を入力して、絞り込んで検索したページをスクレイピングということは可能でしょうか。
何とぞよろしくお願いいたします。
該当のソースコード
import requests import lxml.htmnl r = requests.get("http://www.kaigokensaku.mhlw.go.jp/27/index.php?action_kouhyou_pref_search_list_list=true&PrefCd=27") root = r.lxml.html.fromstring(html) next = root.xpath("//*[@id="pagerTop"]/ul/li[3]/a") URL = next[0].attrib("href")
みたいなことをやってみましたが、結局飛んだ先もURLが変わらないため、同じページをrequestsしてしまいます。
試したこと
補足情報(FW/ツールのバージョンなど)
python3でやっています。
回答3件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/12/19 04:41