下記のWebスクレイピングをしたいのですが、文字化けしてしまいました。
対処方法を教えていただけないでしょうか。
Python3で動かしています。
Python
1import requests 2from bs4 import BeautifulSoup 3 4# WebサイトのURLを指定 5url = "https://www.nttdocomo.co.jp/js_osp/area/servicearea/service_map_5g/service_map.php?lat=35.84955538350727&lng=139.31292081298892&categoryCd=%22all%22&isTakeLeast=false&latNorthEast=36.539996011807645&lngNorthEast=140.60106778564517&latSouthWest=35.153050415318106&lngSouthWest=138.02477384033267" 6 7# Requestsを利用してWebページを取得する 8r = requests.get(url) 9print(r.text)
結果一部抜粋
{"fitBound":false,"hidden":0,"data":[{"category_cd":"004","category":"\u30c9\u30b3\u30e2\u30b7\u30e7\u30c3\u30d7","region_cd":"3","region":"\u95a2\u6771\u30fb\u7532\u4fe1\u8d8a","pref_cd":"08","pref":"\u8328\u57ce\u770c","facility_spot_name":"\u30c9\u30b3\u30e2\u30b7\u30e7\u30c3\u30d7\u3072\u305f\u3061\u306a\u304b\u5e97","detail":"\u5e97\u8217\u5185","available_time_cd":"0","available_time":"\u5f53\u6708\u672b","lng":"140.543248","lat":"36.397522","ehf":"1","available_time_txt":"2020\u5e7410\u6708\u672b\u6642\u70b9","ehf_txt":"\u30df\u30ea\u6ce2\u5bfe\u5fdc"},
正しい結果だと思います(=そのサーバからそのようにデータが来ているのであって文字化けだと思っている方が間違い)ので、そうすると質問は「このデータをどうしたらいいですか?」になってしまうわけですが、JSONのデータ形式についてご存じないということでしょうか?
ありがとうございます。
文字化けの問題を解決しJSON形式でデータ取得する方法を教えていただけないでしょうか。
質問者様は、どういったページをスクレイピングしようとし
スクレイピングをして何をどうしようと考えていらっしゃるのでしょうか?
「スクレイピングをしたかった」というのはわかりますが、もう少し具体的な目的がわかれば回答がしやすいです。
スクレイピングしたいページは上記プログラムのURLです。
スポット情報が記載されているページです。
具体的にはレスポンスで帰ってくるjsonファイルの[data]の項目を抜き出し、jsonもしくはcsvで出力したいと考えております。
回答3件
あなたの回答
tips
プレビュー