mildomのランキングサイトをスクレイピングしようと考えています。
言語はpythonです。
しかし、ランキングサイトゆえに、定期的にwebサイトが更新されるため、
非同期通信を行われていると思われます。
そうなるとbeautifulsoupを使用するとhtml補完が行われるためソースがブラウザと差異が生まれ、
うまくスクレイピングすることができません。
そのため、seleniumを使ってスクレイピングをしようと考えているのですが、
普通のサイトのままでやると、ソースが多くやりにくいです。
そこで、以前ツイキャスをスクレイピングした際に、非同期通信のajaxという技術が使われていて、
ランキングの情報だけが書かれているリンクが存在しました。
ツイキャス:普通のランキングサイト
https://twitcasting.tv/rankingindex.php
ツイキャス:ajax ランキングサイト
https://twitcasting.tv/rankingajax.php?d=20210805&type=daily&genre=girls_jd_jp
知りたいこと
もし、mildomでもこのようなデータだけまとめられているような非同期通信のデータをやり取りの送信元のサイトがあったら教えてほしいです。
(自分も探してみたが、わからなかった。ちなみにツイキャスのリンクも人に教えてもらった。)
試したこと
検証で関係のありそうなurlを調べた。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/08/13 11:07