前提・実現したいこと
python3.7.2
beautifulsoup4
html_parser
上記の環境にてスクレイピングを実施、該当する情報を取得したい。
■■な機能を実装中に以下のエラーメッセージが発生しました。
発生している問題・エラーメッセージ
Python3.7.2環境で、print() の際utf-8ケアはしているのですが、日本語部分が文字化けしてしまいます。
本来 「Yahooニュース」と出力させたいところ、現状は下記のような出力となります。
b'Yahoo!\xe3\x83\x8b\xe3\x83\xa5\xe3\x83\xbc\xe3\x82\sb9'
import requests from bs4 import BeautifulSoup In [7]: url = 'http://news.yahoo.co.jp/topics' r = requests.get(url) print(r.status_code) print(r.encoding) soup = BeautifulSoup(r.content, 'html.parser') elements = soup.find_all('title') for e in elements: some = e.text.encode('utf-8') print(some) ```ここに言語名を入力 python3.7.2 beautifulsoup4 html_parser
試したこと
サイト上のEncoding宣言はUTF-8であることを確認しました
utf-8をケアするため、改めてencodeでutf-8を宣言しました。
補足情報(FW/ツールのバージョンなど)
ここにより詳細な情報を記載してください。
回答3件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/01/13 07:39
2019/01/13 08:28