前提・やりたいこと
現在、自分が過去にはてなスターを付けたはてなブログエントリーを全て取得したいと思っています。
はてなスターの履歴閲覧ページ自体は https://s.hatena.ne.jp/[ユーザー名]/stars として公式に用意されているのですが、このページは直近2~3ヶ月前後にはてなスターを押したエントリーしか表示されない仕様であり、これでは「全てのエントリーの情報が欲しい」という要件を満たすことが出来ません。はてな運営にもメールで問い合わせましたが「全エントリーの一覧を取得する手段は提供していない」という回答を得ました。
なお「特定の記事に付いたはてなスターの情報」を取得するAPIは存在するとのことでした。
そのため代案として「ブラウザ閲覧履歴の中からはてなブログのエントリーのみを抽出し、その全てに対し上述のAPIを叩いて自分がはてなスターを付けたか判定する」という愚直な方法を考えています。
しかし、はてなブログでは独自ドメインの利用が可能であるため、URLのみを頼りにはてなブログのエントリーを抽出すると独自ドメインのブログのエントリーが漏れてしまいます。
はてなブログoEmbed APIを利用することも考えているのですが、APIへのアクセス速度やサーバ負荷を考慮すると、これを使って高速に処理するのは難しいのではないかという懸念があります。
質問
任意のURLがはてなブログの記事であるか否かを高速に判定する方法はないものでしょうか?
また、これ以外にどうにかしてはてなスターを付けた全エントリーを取得する方法はないものでしょうか?
懸念していること
もし上述の愚直な方法で行くとすると、ただでさえブラウザの閲覧履歴の件数自体が大量にある以上、明らかにはてなブログではないURLを除去してもなお膨大な量のURLをチェックしなければならないため、作業完了までに莫大な時間が必要になってしまいそうに思います。
解決の糸口程度でも構わないのでご意見をお聞きしたいです。よろしくお願いします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/05/14 19:06