java.net.SocketException : Too many open files Spring Hibernate Tomcat 异常

标签 java spring hibernate tomcat nginx

我在生产中的 Linode 服务器上有一些 Hibernate、Spring、Debian、Tomcat、MySql 堆栈和一些客户端。它是一个 Spring-Multitenant 应用程序,可为大约 30 个客户端托管网页。

应用程序启动正常,然后过了一会儿,我收到此错误:

java.net.SocketException: Too many open files
at java.net.PlainSocketImpl.socketAccept(Native Method)
at java.net.PlainSocketImpl.accept(PlainSocketImpl.java:390)
at java.net.ServerSocket.implAccept(ServerSocket.java:453)
at java.net.ServerSocket.accept(ServerSocket.java:421)
at org.apache.tomcat.util.net.DefaultServerSocketFactory.acceptSocket(DefaultServerSocketFactory.java:60)
at org.apache.tomcat.util.net.JIoEndpoint$Acceptor.run(JIoEndpoint.java:216)
at java.lang.Thread.run(Thread.java:662)

然而,在抛出此错误之前,nagios 提醒我对服务器的 ping 停止响应。

以前,我有 nginx 作为代理,并且每个请求都会收到此 nginx 错误,并且无论如何都必须重新启动 tomcat:

2014/04/21 12:31:28 [error] 2259#0: *2441630 no live upstreams while connecting to upstream, client: 66.249.64.115, server: abril, request: "GET /catalog.do?op=requestPage&selectedPage=-195&category=2&offSet=-197&page=-193&searchBox= HTTP/1.1", upstream: "http://appcluster/catalog.do?op=requestPage&selectedPage=-195&category=2&offSet=-197&page=-193&searchBox=", host: "www.anabocafe.com"
2014/04/21 12:31:40 [error] 2259#0: *2441641 upstream timed out (110: Connection timed out) while reading response header from upstream, client: 200.74.195.61, server: abril, request: "GET / HTTP/1.1", upstream: "http://127.0.0.1:8080/", host: "www.oli-med.com"

这是我的 server.xml 连接器配置:

<Connector port="80" protocol="HTTP/1.1"
                maxHttpHeaderSize="8192"
               maxThreads="500" minSpareThreads="250"
               enableLookups="false" redirectPort="8443" acceptCount="100"
               connectionTimeout="20000" disableUploadTimeout="true"
               acceptorThreadCount="2" />

我尝试使用 this tutorial 更改 ulimit我能够为运行 tomcat 的用户更改打开的文件描述符的硬限制,但它没有解决问题,应用程序仍然挂起。

上次我不得不重新启动服务器,它运行了大约 3 个小时,我有这些打开的连接的值:

lsof -p TOMCAT_PID | wc -l
632 (more or less!! i did not write the exact number)

这个数字突然开始增长。

我在其他服务器上有一些与这个应用程序非常相似的应用程序,不同之处在于它们是独立版本,这是一个 Multi-Tenancy 架构,我注意到在这个应用程序中我得到了这些类型的套接字连接,它们不t 出现在任何其他安装的独立版本中:

java    11506 root  646u  IPv6 136862      0t0     TCP lixxx-xxx.members.linode.com:www->180.76.6.16:49545 (ESTABLISHED)
java    11506 root  647u  IPv6 136873      0t0     TCP lixxx-xxx.members.linode.com:www->50.31.164.139:37734 (CLOSE_WAIT)
java    11506 root  648u  IPv6 135889      0t0     TCP lixxx-xxx.members.linode.com:www->ec2-54-247-188-179.eu-west-1.compute.amazonaws.com:28335 (CLOSE_WAIT)
java    11506 root  649u  IPv6 136882      0t0     TCP lixxx-xxx.members.linode.com:www->ec2-54-251-34-67.ap-southeast-1.compute.amazonaws.com:19023 (CLOSE_WAIT)
java    11506 root  650u  IPv6 136884      0t0     TCP lixxx-xxx.members.linode.com:www->crawl-66-249-75-113.googlebot.com:39665 (ESTABLISHED)
java    11506 root  651u  IPv6 136886      0t0     TCP lixxx-xxx.members.linode.com:www->190.97.240.116.viginet.com.ve:1391 (ESTABLISHED)
java    11506 root  652u  IPv6 136887      0t0     TCP lixxx-xxx.members.linode.com:www->ec2-50-112-95-211.us-west-2.compute.amazonaws.com:19345 (ESTABLISHED)
java    11506 root  653u  IPv6 136889      0t0     TCP lixxx-xxx.members.linode.com:www->ec2-54-248-250-232.ap-northeast-1.compute.amazonaws.com:51153 (ESTABLISHED)
java    11506 root  654u  IPv6 136897      0t0     TCP lixxx-xxx.members.linode.com:www->baiduspider-180-76-5-149.crawl.baidu.com:31768 (ESTABLISHED)
java    11506 root  655u  IPv6 136898      0t0     TCP lixxx-xxx.members.linode.com:www->msnbot-157-55-32-60.search.msn.com:35100 (ESTABLISHED)
java    11506 root  656u  IPv6 136900      0t0     TCP lixxx-xxx.members.linode.com:www->50.31.164.139:47511 (ESTABLISHED)
java    11506 root  657u  IPv6 135924      0t0     TCP lixxx-xxx.members.linode.com:www->ec2-184-73-237-85.compute-1.amazonaws.com:28206 (ESTABLISHED)

我猜它们是某种自动连接。

所以我的问题是:

我如何确定问题是由于我的代码、服务器还是某种攻击引起的,您会推荐哪种方法来解决这个问题?

提前谢谢你:)

最佳答案

好的,原来问题出在 jdbc 连接设置上,将 maxActive 设置为 20 个连接,我将限制更改为 200,问题停止了。

我认为这是问题所在的方式要归功于 appdynamics.com 的出色工具,它可以让您检查 ApplicationInfraestructurePerformance 指标中的大量指标。

此外,还找到了这篇关于该主题的精彩文章,它帮助我调整了我的应用程序:

http://www.tomcatexpert.com/blog/2010/04/01/configuring-jdbc-pool-high-concurrency

官方文档也有帮助:

https://tomcat.apache.org/tomcat-7.0-doc/jdbc-pool.html .

我猜测到达的连接首先发起了一个查询,它首先破坏了服务器响应能力,然后填充了操作系统套接字限制,在 linux 中,打开的套接字是打开的文件。我希望这对某人有帮助!

编辑

您好!这个解决方案在短期内解决了这个问题,但是出现了另一个关于 JDBC 连接的错误,应用程序没有关闭连接,我打开并解决了关于那个问题的票证 here

关于java.net.SocketException : Too many open files Spring Hibernate Tomcat 异常,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23252974/

相关文章:

java - 接收 JSON 响应 (android)

java - IP 作为 Linux 数组元素会抛出 UnknownHostException 但作为常量可以正常工作

java - 在服务层中使用 Spring 进行 Bean 验证

java - HSQL 组织.hsqldb.HsqlException : invalid schema name

java - 如何仅获取与 JPA 中其他 2 个表具有 @OneToMany 关系的父记录

java - 路径变量不起作用

java - 当我有字符串时,如何调用需要未知原语的方法?

java - 如何编写一个cron表达式或设置一个在Spring中只执行一次的计时器?

java - 注册。作业级别的 spring 批处理作业的事务支持

hibernate - 使用 DbUnit 将 BigDecimal 数据放入 HSQLDB 测试数据库