htmlを解析できない

こちらのサイトを→(https://www.saiyasune.com/)　
beutifulsoupで解析しようとしたところ、htmlが解析できませんでした。

python
1import requests 
2from bs4 import BeautifulSoup
3
4url = 'https://www.saiyasune.com/'
5res = requests.get(url)
6
7BeautifulSoup(res.content,'html.parser')

コードが違っているのかとほかのサイト（ヤフーや楽天）urlで試したところ、そちらでは取得できました。

色々調べてみたのですが、何が原因かわかりませんでした。

どのように書き換えれば、このサイトのhtmlを解析できるのか、ご教授願いませんでしょうか？

何卒よろしくお願いします。

int32_t

2022/06/27 01:06

解析できないと判断したのはなぜでしょうか。

Yuma0303

2022/06/27 01:25

本来であれば、実行後に”BeautifulSoup(res.content,'html.parser')”で、HTMLが出力されるところ、何も出力されなかったので、解析できてないのではと考えた次第です。（ほかのurlでは出力されたので）

melian

2022/06/27 02:18

リクエストヘッダに User-Agent を付けるとコンテンツを取得できます。 url = 'https://www.saiyasune.com/' headers = { 'User-Agent': 'User-AgentMozilla/5.0 (X11; Linux x86_64; rv:68.0) Gecko/20100101 Firefox/68.0 Waterfox/56.6.2022.04' } res = requests.get(url, headers=headers)

Yuma0303

2022/06/27 07:56

ありがとうございます。無事に解決できました。 User-Agentについて、知らなかったので、とても助かりました。この機会に、詳しく勉強させていただきます。改めてお礼申し上げます。

行動規範の内容に同意します

回答1件

自己解決

上記の melian 様のご回答にて解決できました。

ー以下引用ー

リクエストヘッダに User-Agent を付けるとコンテンツを取得できます。

url = 'https://www.saiyasune.com/'
headers = {
'User-Agent': 'User-AgentMozilla/5.0 (X11; Linux x86_64; rv:68.0) Gecko/20100101 Firefox/68.0 Waterfox/56.6.2022.04'
}
res = requests.get(url, headers=headers)

投稿2022/06/27 08:00

Yuma0303

総合スコア23