みんな大好きGoogle検索サービス。
クローラを用いてインデックス管理しており、
データ量は100PBを超えるそうです。
そんなGoogle検索ですが、
私がよく使う機能として「期間指定」ツールがあります。
どういった仕組みでサイトの日付情報を取得しているのでしょうか。
公開日付なのか、はたまた変更日付なのか。。
プログラムで外部から実際に取得することはモノによって可能です。
例えば、
JavaScriptのdocument.lastModified
これはWebサーバの最終更新日時をResponseHeaderから取得できますが、
当然、Webサーバや設定によって取得できません。
これらを無視して日付情報を取得してしまうのでしょうか。
はたまた欠落情報が存在する場合はインデックスに登録されないのでしょうか。
あなたの回答
tips
プレビュー