Tomcatが突然停止してしまい、503サーバー停止エラーになります。
サーバー自体が死んでいる訳ではないので、Tomcatの再起動を行おうと停止させると
Catalina.stop: java.net.ConnectException: Connection refused
java.net.ConnectException: Connection refused
at java.net.PlainSocketImpl.socketConnect(Native Method)
at java.net.PlainSocketImpl.doConnect(PlainSocketImpl.java:351)
at java.net.PlainSocketImpl.connectToAddress(PlainSocketImpl.java:213)
at java.net.PlainSocketImpl.connect(PlainSocketImpl.java:200)
at java.net.SocksSocketImpl.connect(SocksSocketImpl.java:366)
at java.net.Socket.connect(Socket.java:529)
at java.net.Socket.connect(Socket.java:478)
at java.net.Socket.<init>(Socket.java:375)
at java.net.Socket.<init>(Socket.java:189)
at org.apache.catalina.startup.Catalina.stopServer(Catalina.java:410)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
at java.lang.reflect.Method.invoke(Method.java:597)
at org.apache.catalina.startup.Bootstrap.stopServer(Bootstrap.java:336)
at org.apache.catalina.startup.Bootstrap.main(Bootstrap.java:427)
のエラーが出てくるので、Tomatが停止しているのだとわかりますが、
catalina.outには特にエラーログは出てないようです。
Tomcat 5.0
Linux version 2.6.32-358.14.1.el6.x86_64 (mockbuild@x86-022.build.eng.bos.redhat.com) (gcc version 4.4.7 20120313 (Red Hat 4.4.7-3) (GCC) )
Javaの設定
export CATALINA_OPTS="-Djava.awt.headless=true"
export JAVA_OPTS="-Xms896m -Xmx896m -XX:PermSize=128m -XX:MaxPermSize=128m -Xloggc:/logs/gc.txt -verbose:gc -XX:+PrintGCDetails -XX:+PrintGCDateStamps -XX:+HeapDumpOnOutOfMemoryError"
停止前のcatalina.out最後のログ:
[Unloading class sun.reflect.GeneratedMethodAccessor3310]
停止前のGCログ:
205652.608: [GC 205652.630: [DefNew: 250544K->7984K(275264K), 0.1679260 secs] 678885K->436325K(886976K), 0.2122520 secs] [Times: user=0.02 sys=0.00, real=0.22 secs]
206192.655: [GC 206192.899: [DefNew: 252720K->6824K(275264K), 0.3843100 secs] 681061K->435165K(886976K), 0.8010610 secs]
再起動後のGCログ:
24.031: [GC 24.032: [DefNew: 244736K->5592K(275264K), 0.0791540 secs] 244736K->5592K(886976K), 0.0792450 secs] [Times: user=0.05 sys=0.01, real=0.08 secs]
メモリ情報:
MemTotal: 1695216 kB
MemFree: 647200 kB
Buffers: 36172 kB
Cached: 289876 kB
SwapCached: 0 kB
Active: 841356 kB
Inactive: 103156 kB
Active(anon): 652912 kB
Inactive(anon): 1192 kB
Active(file): 188444 kB
Inactive(file): 101964 kB
このような状況が定期的に発生するのですが、
設定に問題があるのか、回避策があるのか教えていただけないでしょうか?
よろしくお願いします。
追記です。
catalina.outは直前では
[Unloading class sun.reflect.GeneratedMethodAccessor9999]
が続いているのですが、遡ると
java.lang.OutOfMemoryError: Java heap space
Dumping heap to java_pid9785.hprof ...
Exception in thread "ContainerBackgroundProcessor[StandardEngine[Catalina]]" java.lang.OutOfMemoryError: Java heap space
Heap dump file created [300542552 bytes in 97.576 secs]
org.postgresql.util.PSQLException: Ran out of memory retrieving query results.
at org.postgresql.core.v3.QueryExecutorImpl.processResults(QueryExecutorImpl.java:1325)
at org.postgresql.core.v3.QueryExecutorImpl.execute(QueryExecutorImpl.java:195)
Caused by: java.lang.OutOfMemoryError: Java heap space
Error occurred during initialization of VM
Could not reserve enough space for object heap
となっていました。
/var/log/messageを確認すると
kernel: Out of memory: Kill process 9785 (java) score 674 or sacrifice child
kernel: Killed process 9785, UID 0, (java) total-vm:1985376kB, anon-rss:1191028kB, file-rss:268kB
となっているので、
おっしゃるように、OutOfMemoryErrorでプロセスがkillしてしまっているのですね。
頻度は1~2週間毎に発生します。
やはりメモリの設定でしょうか?
落ちてしまった時に、復旧(起動)が最優先のために落ちている時にしか確認できない情報が取れていない状態です。どこにどういう仕込みをすれば良いのかよく分かっていないので、監視的な事がやれていないです。
アプリケーションの操作ログからして特定の処理で発生する訳ではないみたいです。
よろしくお願いいたします。

バッドをするには、ログインかつ
こちらの条件を満たす必要があります。