質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.37%
Pacemaker

Pacemakerとは、クラスタ管理システム(CRM)を実装したオープンソースのソフトウェアです。CorosyncやHeartbeatと協調して動作し、高可用クラスタ上で稼働するアプリケーションなどのリソースを監視・起動・停止できます。

Apache

Apacheは、Apache HTTP Serverの略で、最も人気の高いWebサーバソフトウェアの一つです。安定性が高いオープンソースソフトウェアとして商用サイトから自宅サーバまで、多くのプラットフォーム向けに開発・配布されています。サーバーソフトウェアの不具合(NCSA httpd)を修正するパッチ(a patch)を集積、一つ独立したソフトウェアとして開発されました。

Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

Q&A

1回答

35277閲覧

Apache (internal dummy connection)が大量発生

jukilil

総合スコア11

Pacemaker

Pacemakerとは、クラスタ管理システム(CRM)を実装したオープンソースのソフトウェアです。CorosyncやHeartbeatと協調して動作し、高可用クラスタ上で稼働するアプリケーションなどのリソースを監視・起動・停止できます。

Apache

Apacheは、Apache HTTP Serverの略で、最も人気の高いWebサーバソフトウェアの一つです。安定性が高いオープンソースソフトウェアとして商用サイトから自宅サーバまで、多くのプラットフォーム向けに開発・配布されています。サーバーソフトウェアの不具合(NCSA httpd)を修正するパッチ(a patch)を集積、一つ独立したソフトウェアとして開発されました。

Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

0グッド

2クリップ

投稿2017/12/05 00:40

編集2017/12/05 07:32

助けてください。

Apache (internal dummy connection)が同時刻(秒数まで一緒)で大量発生します。
※ログの件数=apacheの子プロセス数です。

原因、対策方法について知りたいです。


heartbeat+pacemakerで冗長構成を組んでいて、

しかし、タイトルのエラーが発生したタイミングで
failcountが増加してしまうという問題が発生してます。

該当時間でのaccess_logはserver-statusへのアクセスのみです。

■crm configure show

primitive apache ocf:heartbeat:apache \ params configfile="/etc/httpd/conf/httpd.conf" httpd="/usr/sbin/httpd" statusurl="http://10.0.0.1/server-status" \ op start interval="0s" timeout="90s" on-fail="restart" \ op monitor interval="10s" timeout="60s" on-fail="restart" \ op stop interval="0s" timeout="300s" on-fail="block" \ meta migration-threshold="3"

一時的にアクセスが増加し、プロセスも増えたというわけでもなさそうですし、
MaxRequestsPerChildの上限値に達したことによるkillでもなさそうです。

現状、上記問題が発生するたびにfailcountリセットを実施している状況です。

知見のある方、お助けお願いします。

■サーバ情報とか
Red Hat Enterprise Linux Server release 6.6
httpd-2.2.15-60.el6.centos.6.x86_64
heartbeat-3.0.5-1.1.el6.x86_64
pacemaker-1.0.13-1.el6.x86_64

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2017/12/05 02:51

大量発生する根本原因を対策したいのか、ログファイルを圧迫しないように出力を制御したいのか、どちらでしょうか。
jukilil

2017/12/05 02:53

ありがとうございます。今回は、原因と対策が知りたいです。
guest

回答1

0

すでに調べられているかとは思いますが、[internal dummy connection]は
Apacheのいつだかのバージョンから追加された機能に付随するログです。
Processを安全に切るための機能で、その際にdummyへの接続が必要不可欠であり
[internal dummy connection]はそれを示すログとなります。

このため、[internal dummy connection]の出力自体は問題ないですが
その出力数が異常であるということであれば、Apacheの子プロセスが増殖される原因を調べる必要があります。
単純に外部からのアクセスもそうですが、冗長化構成とのことなので
ヘルスチェックの動作を見直してみることも糸口になるかもしれません。

※「apacheプロセスも冗長」の部分も若干、気になりますが・・・

投稿2017/12/05 07:23

k-nishiyama

総合スコア240

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

jukilil

2017/12/05 07:31

k-nishiyamaさま ご回答ありがとうございます。 子プロセスは30個ほど用意してしていて、(StartServer) そのプロセス分のinternal dummy connectionが発生するということです。 恐らく、プロセスは増殖してないと思います。 ちなみに、外部アクセスはほぼないです。 apache以外でinternal dummy connectionを誘発させるものって あるのかなぁと考えているところです。 ※apacheプロセスも冗長  →これはすみません。誤解を招きました。削除します。   ただ単にリソースとして登録しているという意味です。
k-nishiyama

2017/12/05 07:40

jukilil 様 > ヘルスチェックの動作を見直し こちらは如何でしょうか failcountの増加と[internal dummy connection]の出力が同タイミングであるならば ヘルスチェックがエラーになる原因があるのでは?と考えています。 ・ページ自体は閲覧できる ・pacemaker側でfailcountが増加する こうなると、Apacheではなくpacemaker側の動作ログとか見たほうが良い気がします。 ※たしかpacemakerの動作状況ログって出力できましたよね?
jukilil

2017/12/05 07:56 編集

k-nishiyamaさま > こうなると、Apacheではなくpacemaker側の動作ログとか見たほうが良い気がします。 確かに、 failcount増加と[internal dummy connection]の発生タイミングは同じでした。 それを踏まえた上でpacemaker側のログを確認したところ、 ERROR: Failed to access httpd status page. というステータスページにアクセスできなかったというログがありました。 つまり、 ステータスページにアクセスできずに pacemakerが異常と判断し、apacheの再起動を実施し、 internal dummy connectionが大量発生したという可能性が高いです。 ありがとうございます! ただ、このサーバ2年近く動作してて 初めてこんな動きをしているんですよね。。
k-nishiyama

2017/12/05 08:01

jukilil 様 いえ、解決に近づけているようで良かったです。 実際にローカルからwgetコマンドを用いてステータスページを参照し、 正しいデータが取得できるか?などのチェックを行うと、更に先に進める気がします。 今まで問題なくヘルスチェックができていたということであれば、 SSLに起因したエラーや、ローカルからステータスサイトを見た際の参照先が以前と異なる、など 原因は色々考えられるかと思いますので、Apacheのエラーログなどを確認しつつ対象を絞り込めていけたらいいですね。
jukilil

2017/12/05 08:14

k-nishiyamaさま そうですね。。 server-statusのログでも取得して その時何が起きているのか確認してみたいと思います。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.37%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問