jupyter notebookを使ってpythonを練習している初心者です。
下記のコードを書いたら、ヤフーニュースのタイトルを抜き出せました。しかし、URLの部分をライブドアニュースに張り替えても、ライブドアのニュースタイトルをうまく抜き出せまでした。エラーが添付画像のようにでてきました。utf-8の部分が間違っているようなのですが、どのように修正したらよろしいのでしょうか?
#ヤフーニュース用のスクレイピング
from urllib.request import urlopen
from bs4 import BeautifulSoup
from pprint import pprint
URL='https://news.yahoo.co.jp/'
with urlopen(URL) as res:
html=res.read().decode("utf-8")
soup=BeautifulSoup(html, 'html.parser')
titles=soup.select('.ttl a')
titles=[t.contents[0]for t in titles]
pprint(titles)
#ライブドアニュース用のスクレイピング
from urllib.request import urlopen
from bs4 import BeautifulSoup
from pprint import pprint
URL = 'http://news.livedoor.com/'
with urlopen(URL) as res:
html = res.read().decode("utf-8")
soup = BeautifulSoup(html, 'html.parser')
titles = soup.select('.ttl a') # domを取得
titles = [t.contents[0] for t in titles] # テキストを取得
pprint(titles)