複数のページ(1,000URL程。URLの変更や数の増減も有)をクロールし、そのページ1つ1つのtitleが変更されたかどうかを知りたいと思っています。
この場合、データベース(MySQL5.7)にどのようなテーブルを作れば良いでしょうか?
仕組みとしては、前回のクロール結果と直近のクロール結果を比較するわけなので、データを登録するためのテーブルを2つ作れば良いかと考えました。
具体的には以下です。
▼テーブル1
ページURL VARCHAR(2083) 主キー
ページタイトル VARCHA(100)
日時 TIMESTAMP
▼テーブル2
ページURL VARCHAR(2083) 主キー
ページタイトル VARCHA(100)
日時 TIMESTAMP
クロールの度、古い方のテーブルに書き込み、もう一方と比較。titleの変更を見る、というやり方です。
ただしこれだと、主キーが長すぎて無駄に重くなってしまうと思います。
何かいい方法はないものでしょうか?

回答3件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/01/22 12:27