質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

Q&A

解決済

1回答

3331閲覧

Ruby URL先が存在するか判断したい

退会済みユーザー

退会済みユーザー

総合スコア0

Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

0グッド

0クリップ

投稿2018/05/13 03:19

編集2018/05/13 06:02

前提・実現したいこと

引数にURLを渡すと、そのWEBページが存在するかどうかを真偽値で返すメソッドを作ろうと思っています。
http://piko.hateblo.jp/entry/2013/05/24/194739
上のページで、以下のようなコードを見つけたので試してみました。

ruby

1def url_request(url, limit = 10) 2 if limit == 0 3 return false 4 end 5 begin 6 response = Net::HTTP.get_response(URI.parse(url)) 7 rescue 8 return false 9 else 10 case response 11 when Net::HTTPSuccess 12 return true 13 when Net::HTTPRedirection 14 url_request(response['location'], limit - 1) 15 else 16 return false 17 end 18 end 19end 20 21puts url_request("http://www.nogizaka46.com/")

発生している問題・エラーメッセージ

大好きな乃木坂46のサイト(http://www.nogizaka46.com/)で試してみたところ、結果が"false"となってしまいました。
しかし、例えばamazon(https://www.amazon.co.jp/)ではちゃんと"true"が返ってきます。

こういった場合、何が原因で、どのように対応したらいいのでしょうか?

補足情報(FW/ツールのバージョンなど)

  • windows10
  • windows subsystem for linux(ubuntu)
  • ruby 2.5.1

ご回答、アドバイスをいただけると幸いです。

追記

otnさんのアドバイスを参考にして、メソッドを以下に書き換えてみました!

ruby

1def url_exist?(uri) 2 agent = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36" 3 url = URI.parse(uri) 4 begin 5 Net::HTTP.new(url.host).get({"User-Agent": agent}) 6 rescue 7 return false 8 else 9 return true 10 end 11end 12 13# 存在するページ 14puts url_exist?("http://www.nogizaka46.com/") 15 16# 存在しないページ 17puts url_exist?("http://www.nogizaka46aaa.com/")

とすると、結果がうまく出力されました!

true false

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

User-Agentヘッダを見ているようです。何らかのブラウザのUser-Agentを使ってください。

Ruby

1 IE11="Mozilla/5.0 (Windows NT 6.3; WOW64; Trident/7.0; rv:11.0) like Gecko" 2 url = URI.parse("http://www.nogizaka46.com/") 34 begin 5 Net::HTTP.new(url.host).get(url.path,{"User-Agent"=> IE11}) 6 rescue

投稿2018/05/13 04:35

編集2018/05/15 05:26
otn

総合スコア84499

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2018/05/13 06:03

ありがとうございます、解決しました。! User-Agentも初耳でしたので、大変勉強になりました!
退会済みユーザー

退会済みユーザー

2018/05/13 07:40

ごめんなさい。 これについて、追加で質問があります。 もしよければそちらも一読していただけると幸いです。。
otn

2018/05/13 10:58

あれ、なんか、Teratailのバグかな。 コピペミスしたかと、編集で開くと、ちゃんと書いた通り、 Net::HTTP.new(url.host).get(url.path,{"User-Agent"=> IE11}) となっているのですが、表示がおかしいですね。
otn

2018/05/13 11:22

右下の意見欄から、バグレポートを送っておきました。そのうちになおるかと。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問