質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
CentOS

CentOSは、主にRed Hat Enterprise Linux(RHEL)をベースにした、フリーのソフトウェアオペレーティングシステムです。

Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

Q&A

解決済

2回答

8409閲覧

サーバーがプログラムの外部接続を拒否する

yuki_90453

総合スコア326

CentOS

CentOSは、主にRed Hat Enterprise Linux(RHEL)をベースにした、フリーのソフトウェアオペレーティングシステムです。

Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

0グッド

0クリップ

投稿2017/04/06 04:26

編集2017/04/06 04:39

いつもお世話になっております。
スクレイピングを行うプログラムで下記のログのように外部接続を行うとサーバーがプログラムを拒否してしまい途中でプログラムが止まってしまいます。

/usr/local/rbenv/versions/2.3.1/lib/ruby/2.3.0/net/http.rb:882:in `rescue in block in connect': Failed to open TCP connection to 127.0.0.1:8910 (Connection refused - connect(2) for "127.0.0.1" port 8910) (Errno::ECONNREFUSED) from /usr/local/rbenv/versions/2.3.1/lib/ruby/2.3.0/net/http.rb:879:in `block in connect' from /usr/local/rbenv/versions/2.3.1/lib/ruby/2.3.0/timeout.rb:91:in `block in timeout' from /usr/local/rbenv/versions/2.3.1/lib/ruby/2.3.0/timeout.rb:101:in `timeout' from /usr/local/rbenv/versions/2.3.1/lib/ruby/2.3.0/net/http.rb:878:in `connect' from /usr/local/rbenv/versions/2.3.1/lib/ruby/2.3.0/net/http.rb:863:in `do_start' from /usr/local/rbenv/versions/2.3.1/lib/ruby/2.3.0/net/http.rb:852:in `start' from /usr/local/rbenv/versions/2.3.1/lib/ruby/2.3.0/net/http.rb:584:in `start' from /var/www/html/Ruby/Application/ReviewList/vendor/bundle/ruby/2.3.0/gems/selenium-webdriver-3.3.0/lib/selenium/webdriver/common/service.rb:93:in `connect_to_server' from /var/www/html/Ruby/Application/ReviewList/vendor/bundle/ruby/2.3.0/gems/selenium-webdriver-3.3.0/lib/selenium/webdriver/common/service.rb:116:in `stop_server' from /var/www/html/Ruby/Application/ReviewList/vendor/bundle/ruby/2.3.0/gems/selenium-webdriver-3.3.0/lib/selenium/webdriver/common/service.rb:79:in `stop' from /var/www/html/Ruby/Application/ReviewList/vendor/bundle/ruby/2.3.0/gems/selenium-webdriver-3.3.0/lib/selenium/webdriver/common/service.rb:69:in `block in start' from /var/www/html/Ruby/Application/ReviewList/vendor/bundle/ruby/2.3.0/gems/selenium-webdriver-3.3.0/lib/selenium/webdriver/common/platform.rb:138:in `block in exit_hook

ログにもあるTCP 8910ですが、リッスンされておりませんでした。
他に8910で被っているプロセスも見つかりませんでした。

tcp 0 0 0.0.0.0:8911 0.0.0.0:* LISTEN 4442/phantomjs tcp 0 0 0.0.0.0:8912 0.0.0.0:* LISTEN 7428/phantomjs

###iptables

Chain INPUT (policy ACCEPT) target prot opt source destination f2b-dovecot-pop3imap tcp -- anywhere anywhere multiport dports pop3,imap f2b-SSH tcp -- anywhere anywhere tcp dpt:ssh RH-Firewall-1-INPUT all -- anywhere anywhere ACCEPT tcp -- anywhere anywhere tcp dpt:hbci ACCEPT tcp -- anywhere anywhere state NEW tcp dpt:telnet Chain FORWARD (policy ACCEPT) target prot opt source destination RH-Firewall-1-INPUT all -- anywhere anywhere Chain OUTPUT (policy ACCEPT) target prot opt source destination Chain RH-Firewall-1-INPUT (2 references) target prot opt source destination ACCEPT all -- anywhere anywhere ACCEPT icmp -- anywhere anywhere icmp any ACCEPT esp -- anywhere anywhere ACCEPT ah -- anywhere anywhere ACCEPT udp -- anywhere 224.0.0.251 udp dpt:mdns ACCEPT udp -- anywhere anywhere udp dpt:ipp ACCEPT tcp -- anywhere anywhere tcp dpt:ipp ACCEPT all -- anywhere anywhere state RELATED,ESTABLISHED ACCEPT tcp -- anywhere anywhere state NEW tcp dpt:10022 ACCEPT tcp -- anywhere anywhere state NEW tcp dpt:http ACCEPT tcp -- anywhere anywhere state NEW tcp dpt:https ACCEPT tcp -- anywhere anywhere state NEW tcp dpt:smtp ACCEPT tcp -- anywhere anywhere state NEW tcp dpt:urd ACCEPT tcp -- anywhere anywhere state NEW tcp dpt:submission ACCEPT tcp -- anywhere anywhere state NEW tcp dpt:pop3 ACCEPT tcp -- anywhere anywhere state NEW tcp dpt:pop3s ACCEPT tcp -- anywhere anywhere state NEW tcp dpt:imap ACCEPT tcp -- anywhere anywhere state NEW tcp dpt:imaps REJECT all -- anywhere anywhere reject-with icmp-host-prohibited Chain f2b-SSH (1 references) target prot opt source destination RETURN all -- anywhere anywhere Chain f2b-dovecot-pop3imap (1 references) target prot opt source destination RETURN all -- anywhere anywhere

###気になる点
接続を拒否されているタイミングは、初回の接続ではなくアクセスしてしばらくしてからになります。webサイトの3ページ目ぐらいでアクセスが拒否され止まっています。

何かプロセスが動的に拒否しているのではないかと考えているのですが、関係あるのでしょうか?

###質問
この問題の際でプログラムが全滅してしまい大変困っております。どなたでもいいので怪しい部分があればご指摘お願い致します。

###環境
CentOS6
Ruby
Selenium
PhantomJS
VPS

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

kunai

2017/04/06 04:51

rubyはよくわかっていませんが、127.0.0.1というIPアドレスは自分自身を表すものです。本当に外部に接続しようとしているのでしょうか。
yuki_90453

2017/04/06 04:56

はい、サーバにはwebページは入っていないので、サーバー内部のサイトにアクセスしようとしているのはないと思います
kunai

2017/04/06 05:10

いや、つまり外部に接続しているつもりなのに、なぜか127.0.0.1という自分自身にアクセスしており、さらにそのPortがListenされていないのでConnect出来ないという問題なのではないかなと思うわけです。出来れば通信部分のソースコードを提示いただけないでしょうか。
guest

回答2

0

自己解決

再起動したらいけました。

投稿2017/04/06 07:04

yuki_90453

総合スコア326

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

多くのサイトは「高負荷なアクセスが来たらブロックする」という防護策が講じられています。あまりに短時間に多数のアクセスを行うと、サーバがダウンしてしまう前に悪さをしているやつを弾き飛ばしてしまいます。あなたに悪意がなくても、高速にアクセスしまくる行為は「DoS攻撃」と呼ばれるもので、サーバに高負荷を与えてアクセス不全に陥らせる行為です。
スクレイピングの際は「1アクセスごとに何秒か待機する」など、対象のサーバに負荷を与えない配慮が必要です。そもそも対象のサイトがスクレイピングを禁止していないかもチェックしてください。

投稿2017/04/06 04:49

masaya_ohashi

総合スコア9206

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yuki_90453

2017/04/06 04:52

回答頂きありがとうございます。 念の為、sleepで数秒を入れてあります。 スクレイピングを行っているサイトは複数あり、どれも同じエラーでプログラムが中断されます。 また拒否しているのは「127.0.0.1」となっており調べて見るとlocalhostが拒否しているようです。
masaya_ohashi

2017/04/06 05:16

んー…となるとセレニウム関連のエラーだと思うので、私は詳しくないです。申し訳ないですが誰か他の人の回答を待ってください。とりあえず、私がエラーログから分かることは、スクレイピング処理がなんらかの要因でタイムアウトしているっぽい、というところでしょうか。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問