pythonによるスクレイピングでHTMLを取得したい

pythonでrequestsを使って、WebページからHTMLを取得しようとしています。
具体的には読書メーターのページの作家名を検索した時のHTMLを取得したいのですが、
https://bookmeter.com/search?keyword=夏目漱石のようなURLでpythonのrequestsを使ってアクセスすると、WebページのHTMLではなく、検索した作家の本の情報が格納されたJSONデータが返ってきてしまいます。

普通にブラウザからアクセスすると、Webページが表示される（HTMLで返ってくる）のに、プログラムからアクセスするとJSONが返ってくるのはどういった仕組みになっているのでしょうか。
それとプログラムからアクセスした場合にもHTMLを取得するにはどうすれば良いのでしょうか。

ご教授いただけますと幸いです。よろしくお願いいたします。

（追記）
コードはこんな感じです。

import requests

url = 'https://bookmeter.com/search'
params = {
    'keyword': '夏目漱石'
}
r = requests.get(url, params=params)
print(r.headers['content-type'])
print(r.text)

printしたContent-Typeを見てみるとapplication/jsonとなっているのですが、
どのように実行したらhtmlで返ってきましたでしょうか。

（追記）
コンソールで次のコードを打っても、同じくjsonが返ってきました。

curl -X GET https://bookmeter.com/search?keyword=%E5%A4%8F%E7%9B%AE%E6%BC%B1%E7%9F%B3

moscow3

2018/10/20 06:00

こちらでやってみたところ普通にHTMLが返ってきました。　実行したコードを載せてもらはないことには何が原因かは分かりません。　（とはいえ、実際に処理するならjsonのほうが使いやすいのではと思ったりも・・）

行動規範の内容に同意します

回答2件

私が試したところでは、curl -X POST...とするとhtmlが返ってくるようですね。当該サイトでは、リクエストの種類によって違うものを返すように設定されているということではないでしょうか。

投稿2018/10/20 08:40

KojiDoi

総合スコア13671

kazuki__

2018/10/20 11:08

なるほど、確かにPOSTするとhtmlが返ってきますね。ブラウザからのアクセスってGETリクエストかと思っていたんですが、POSTリクエストにも出来るんですね。そこのところ実装の仕方いまいちよくわかりませんが、調べてみます！回答ありがとうございます！

行動規範の内容に同意します

ベストアンサー

APIのエンドポイントがそのままURLなのでしょうか？（申し訳ないですが正確なことは分からないので他の方からの回答を期待してください）

とりあえず、　beauriful soupとurllibを用いた動くサンプルです。
（pip installが必要です）

python
1from bs4 import BeautifulSoup
2import urllib.request
3url = 'https://bookmeter.com/search?keyword=%E5%A4%8F%E7%9B%AE%E6%BC%B1%E7%9F%B3'
4req = urllib.request.Request(url)
5response = urllib.request.urlopen(req)
6html = response.read()
7soup = BeautifulSoup(html, "lxml")
8print(soup)

また、、出力の時点でパースされているので、

python
1  elms = soup.find_all(class_='class_name')
2  for elm in elms:
3    print(elms.txt)

みたいに特定のクラスの要素だけ取得して出力とかもできます。

投稿2018/10/20 08:09

moscow3

総合スコア201

kazuki__

2018/10/20 08:19

回答ありがとうございます！サンプルを動かしてみたところ、期待通りの動作でした。今回叩いてるURLは普通のWebページのURLでAPIのエンドポイントではないと思います。でもどうしてurllibで叩くと、HTMLが返ってくるのに、 requestsで叩くと、JSONが返ってくるのでしょうか。そこの違いがよくわかりません。

行動規範の内容に同意します

あなたの回答