質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Google Analytics

Google AnalyticsはGoogleが開発した無料のウェブ分析のソリューションです。複数のクライアント側のAPIとデータをエクスポートし管理するREST APIも格納されています。

セキュリティー

このタグは、コンピューターシステムの安全性やデータの機密性に関連したトピックの為に使われます。

Webサイト

一つのドメイン上に存在するWebページの集合体をWebサイトと呼びます。

Google

Googleは、アメリカ合衆国に位置する、インターネット関連のサービスや製品を提供している企業です。検索エンジンからアプリケーションの提供まで、多岐にわたるサービスを提供しています。

Q&A

解決済

3回答

997閲覧

何者かにWebサイトをクロールされた?

mobumobu

総合スコア11

Google Analytics

Google AnalyticsはGoogleが開発した無料のウェブ分析のソリューションです。複数のクライアント側のAPIとデータをエクスポートし管理するREST APIも格納されています。

セキュリティー

このタグは、コンピューターシステムの安全性やデータの機密性に関連したトピックの為に使われます。

Webサイト

一つのドメイン上に存在するWebページの集合体をWebサイトと呼びます。

Google

Googleは、アメリカ合衆国に位置する、インターネット関連のサービスや製品を提供している企業です。検索エンジンからアプリケーションの提供まで、多岐にわたるサービスを提供しています。

0グッド

2クリップ

投稿2019/06/02 09:31

先日、私が運営しているWebサイトで、ある日のある時間帯に不審なアクセスが急増していました。

Googleアナリティクスによるとユーザー数は100ほどで、属性は共通して以下のようになっています。
・チャネルはDirect(直接URLを打った?)
・地域はアメリカのある州のある場所のみ。
・ランディングページが、Webサイトのすべてのページに1回ずつ

つまり、1ページにつき1人がアクセスを行っていました。
私のWebサイトには100ほどページがあるので、100人がアクセスしたことになります。
(実際には一人であると考えられます)
いずれも滞在時間は0秒です。
これはGoogleによるクロールではありませんよね?

明らかに何かのツールを使っているようですが、Webサイトの全てのページを把握し、別のユーザーとしてアクセスする(クロールする)ということは一般ユーザーにも可能なのでしょうか?
またこのような事象はよくあるのか、目的としては何が考えられるのかをお聞きしたいです。

よろしくお願いします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

ベストアンサー

提供いただいた情報から、特徴的なことがあります。

一つは、そもそもGoogleアナリティクスで捕捉できるということは、JavaScriptを有効にしてアクセスしているということです。Gooble Botや、一般的なクローラーはJavaScriptをアクセスしませんので、クローラーだとすると、ヘッドレスブラウザなどを用いてスクレイピングしていることになります。

もう一つは、クッキーを無効化していると思われる点です。ヘッドレスブラウザを用いてクッキーを有効していると、ユーサー数は 1 とカウントされるはずだからです。

明らかに何かのツールを使っているようですが、Webサイトの全てのページを把握し、別のユーザーとしてアクセスする(クロールする)ということは一般ユーザーにも可能なのでしょうか?

可能です。クローリングというのものは、そもそもすべてのページを把握するために行うものです。その方法、クローリングの開始ページからリンクをたどることを繰り返し行います。どこからもリンクされていないページはこの方法ではたどれませんが、それは仕方ないでしょう。「別のユーザーとして」というのは、クッキーが処理されてないか、クッキーを無効化したために起こります。こちらは、珍しくなく、クローリングは通常はクッキーを処理しないと思います。

またこのような事象はよくあるのか、目的としては何が考えられるのかをお聞きしたいです。

よくあるでしょうね。私自身さまざまなクローラーを走らせて情報収集をしています。意図の例としては、「世の中で使われているjQueryのバージョンを調べる」などがあります。これはあくまで例です。
今回のクローラーの意図はまったく分かりません。さまざまな意図がありえるからです。

インターネットではよくあることなので気にしないでよいのでは、というのが結論です。

投稿2019/06/05 03:25

ockeghem

総合スコア11701

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

mobumobu

2019/06/05 05:28

非常に詳しい回答ありがとうございました。一般ユーザーがクローラーを使用することもあるのですね! どうやら情報収集のためという可能性が高いようです。こればかりは防ぎようがないので、あまり気にしないようにいたします。
guest

0

明らかに何かのツールを使っているようですが、Webサイトの全てのページを把握し、別のユーザーとしてアクセスする(クロールする)ということは一般ユーザーにも可能なのでしょうか?

google にインデックスされたページであれば可能です。

またこのような事象はよくあるのか、目的としては何が考えられるのかをお聞きしたいです。

よくあるとまでは言えませんが、まったくないとも言えない程度の頻度で発生します。目的はアクセス者にしか分かりません。

投稿2019/06/02 09:38

退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

mobumobu

2019/06/05 05:29

たしかに、Googleで:siteオプションを付ければ簡単に全ページ把握することはできますね! 回答ありがとうございました!
guest

0

これはGoogleによるクロールではありませんよね?

生のアクセスログを見ればわかる話ですよ。
レンタルサーバーのコントロールパネルなど管理画面から
どこかしらにアクセスログが見られる機能が備わっているはずです。

アクセスログにuser-agentも記録されていれば、
どこかの検索エンジンであれば
「user-agent 一覧」などと検索して辿れるページにまとめられているような
痕跡を残します。
また、botやクローラーだとしてもふつうのwebブラウザのふりして
アクセスする場合もあります。

投稿2019/06/03 00:54

退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

mobumobu

2019/06/05 05:31

回答ありがとうございました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問