質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
SEO

SEO(Search Engine Optimization)は、検索エンジンでウェブページがランキング上位に上がるように工夫する様々なテクニックの事です。

検索

検索は、あるデータの集まりの中から 目的のデータを見つけ出すことです。

Google

Googleは、アメリカ合衆国に位置する、インターネット関連のサービスや製品を提供している企業です。検索エンジンからアプリケーションの提供まで、多岐にわたるサービスを提供しています。

Q&A

解決済

2回答

445閲覧

Googleロボットは拡張子がデタラメのファイルもインデックスしますか?

wakaba

総合スコア28

SEO

SEO(Search Engine Optimization)は、検索エンジンでウェブページがランキング上位に上がるように工夫する様々なテクニックの事です。

検索

検索は、あるデータの集まりの中から 目的のデータを見つけ出すことです。

Google

Googleは、アメリカ合衆国に位置する、インターネット関連のサービスや製品を提供している企業です。検索エンジンからアプリケーションの提供まで、多岐にわたるサービスを提供しています。

0グッド

0クリップ

投稿2018/07/23 03:28

編集2018/07/23 03:36

例えば、index.htmlというファイルがあり、検索結果にも出るようなファイルがあったとします。

これの拡張子を変更し、index.hogehogeに変えます。
元のhtmlファイルはなくなり、代わりにでたらめの拡張子のファイルがある状態です。
公開状態なのでindex.hogehogeでURLを叩けばファイルのコードは表示されます。

このような状態のファイルをGoogleロボットは巡回にきてインデックスしますか?
Googleロボットはrobot.txtで指定されていない条件のファイルはどのような判断でインデックスしているのでしょうか?
noindexなどの知識はありますが、この辺りのロボットの判断基準が理解できていません。
Google公式にこの件について分かる解答リンクがあれば教えてください。

※注意:アクセス制限の仕方等については質問していません。
※追記1:「Googleロボット」と書きましたがクローラー全般を対象にした一般的(多数派)な動作を知りたいです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

Googleでは「.html」等のサイト関連以外にも、各種のファイル形式がインデックスされますが、質問にあるような適当な拡張子は、登録可能な「ファイル形式」と認められず、インデックスされない可能性が高いと、個人的には思います。

※試したことはないので推測です。
※インデックスされなくても公開すればURLさえあっていれば、内容は表示されます。

インデックスされたかどうかは検索窓に「site:(サイトURL)」で確認するのが分かりやすいと思います。

参考
Google によるインデックス登録が可能なファイル形式

投稿2018/07/23 18:43

編集2018/07/23 18:47
yoshinavi

総合スコア3521

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

wakaba

2018/07/24 01:41

回答ありがとうございます。 リンク先を確認させていただきました。 site:での確認方法もありがとうございます、 実際にサイトにファイルを設置してリンクがなくともインデックスされるか確認したほうがよさそうですね。
wakaba

2018/07/26 01:09

迷いましたがGoogleの参考リンクがとても役にたったのでこちらをベストアンサーにさせていただきました、ありがとうございました。
guest

0

このような状態のファイルをGoogleロボットは巡回にきてインデックスしますか?

http://domain.example/だけで表示できるとか、あとは別なページからリンクしていたり、robots.txtAllowしていたりすればインデックスはされます。

規約で決まっているrobots.txtは除いて、まっとうなクローラーであれば、「あるのかもわからないページをむやみやたらアクセスする」ような行儀の悪いまねをすることはないでしょう。

もっとも、どこかの誰かが/index.hogehogeへリンクを貼らないとも限らないので、これだけでクロールされないことも保証はできません。

投稿2018/07/23 04:50

maisumakun

総合スコア145121

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

wakaba

2018/07/23 06:08

回答ありがとうございます。 拡張子がデタラメであったとしても ・サイトURL(リンクされたURL)で表示できる状態 ・別ページでリンクURLが貼られている(index.hogehoge宛に)(第三者にリンクを貼られることも考慮する) ・robots.txtで指定している この3パターンであればインデックスはされてしまう。 それ以外ではまともなクローラーならインデックスしない、という理解をしました。 2つ目のパターンはこちらではどうしようもないですね。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問