前提・実現したいこと
pythonでwebスクレイピングをしてこちらのサイト(「国土交通省地価公示・都道府県地価調査」http://www.land.mlit.go.jp/landPrice/AriaServlet?MOD=2&TYP=0)
で地価の情報を集めています。
そのためにクローラーを使って地図をクリックし、その先のurlにリクエストしたいと考えていますが、
areaというタグのhref要素が href = "javascript:submit_f('number')"となっており、
このhrefにアクセスしようと思ってもすることができません。
このアドレスにクローラーでrequestする方法はあるのでしょうか。
よろしくお願い致します。
発生している問題・エラーメッセージ
InvalidSchema Traceback (most recent call last) <ipython-input-20-5c21d5d35b04> in <module>() 12 prefecture = root.xpath("//*[@id='map']/area[20]") 13 url = prefecture[0].attrib["href"] ---> 14 requests.post(url) InvalidSchema: No connection adapters were found for 'javascript:submit_f('27')'
該当のソースコード
import requests import lxml.html r = requests.get("http://www.land.mlit.go.jp/landPrice/AriaServlet?MOD=2&TYP=0") html = r.text root = lxml.html.fromstring(html) prefecture = root.xpath("//*[@id='map']/area[20]") url = prefecture[0].attrib["href"] requests.post(url)
試したこと
seleniumでgoogledriverでリクエストしようとしてもできなかったです。
補足情報(FW/ツールのバージョンなど)
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/12/08 14:14