当方python初心者です。
htmlをrequestsを用いてダウンロードしようとしていますが,文字コード変換がうまくいかず,ダウンロードしたファイルが文字化けします。
htmlはutf-8で記述されており,ideのpyscriperで表示する分には問題ないのですが,ファイルに書き込むと文字化けして(文字コードがutf-8ではなくなっている?)読めません。
調べた結果,日本語を扱うときは,
①入力の際にunicodeに変換
②unicodeで文字列処理
③出力の際に文字コードを指定
すればよいとわかりましたが,どのように変換すればよいかわからず,うまくいかないので質問させていただきました。
どなたかご教授ください。
python
1# coding:utf-8 2import requests 3 4url="https://www.suruga-ya.jp/product/detail/WO10669" 5data=requests.get(url) 6print(data.text) 7print(data.encoding) 8f=open("text.htm","w") 9f.write(data.text) 10f.close()
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。