tomcat大量time wait问题

tomcat大量time wait问题在服务端访问量大的时候检测到大量的timewait,并且接口请求延时较高。执行netstat-n|awk‘/^tcp/{++S[$NF]}END{for(minS)printm,S[m]}’这个shell命令的意思是把netstat-n后结果的最后一条放到S[]数组中,如果相同则执行+1操作。此时能看到TCP各种状态下的连接数量,示例服务端架构是采用nginx

大家好,又见面了,我是你们的朋友全栈君。

在服务端访问量大的时候检测到大量的time wait,并且接口请求延时较高。
执行 netstat -n |awk ‘/^tcp/{++S[$NF]}END{for(m in S) print m,S[m]}’
这个shell命令的意思是把netstat -n 后结果的最后一条放到S[]数组中,如果相同则执行+1操作。
此时能看到TCP各种状态下的连接数量,示例
这里写图片描述

服务端架构是采用nginx 负载均衡后台有多台tomcat。

先说下TCP建立连接和终止连接的流程
tcp三次握手过程:
1、客户端发送SYN(SEQ=x)报文给服务器端,进入SYN_SEND状态。
2、服务器端收到SYN报文,回应一个SYN (SEQ=y)ACK(ACK=x+1)报文,进入SYN_RECV状态。
3、客户端收到服务器端的SYN报文,回应一个ACK(ACK=y+1)报文,进入Established状态。
三次握手完成,TCP客户端和服务器端成功地建立连接,可以开始传输数据了。
这里写图片描述
tcp四次拜拜的过程:
(1) 某个应用进程首先调用close,称该端执行“主动关闭”(active close)。该端的TCP于是发送一个FIN分节,表示数据发送完毕。
(2) 接收到这个FIN的对端执行 “被动关闭”(passive close),这个FIN由TCP确认。
注意:FIN的接收也作为一个文件结束符(end-of-file)传递给接收端应用进程,放在已排队等候该应用进程接收的任何其他数据之后,因为,FIN的接收意味着接收端应用进程在相应连接上再无额外数据可接收。
(3) 一段时间后,接收到这个文件结束符的应用进程将调用close关闭它的套接字。这导致它的TCP也发送一个FIN。
(4) 接收这个最终FIN的原发送端TCP(即执行主动关闭的那一端)确认这个FIN。
这里写图片描述

关于tcp状态转换图建议看下http://www.cnblogs.com/qlee/archive/2011/07/12/2104089.html这篇文章。
这里写图片描述

重点说下time_wait、fin_wait_1、fin_wait_2这三个状态:
time_wait状态表示收到了对方的FIN报文,并发送出了ACK报文,就等2MSL后即可回到CLOSED可用状态了。如果FIN_WAIT_1状态下,收到了对方同时带 FIN标志和ACK标志的报文时,可以直接进入到TIME_WAIT状态,而无须经过FIN_WAIT_2状态。
FIN_WAIT_1: 这个状态要好好解释一下,其实FIN_WAIT_1和FIN_WAIT_2状态的真正含义都是表示等待对方的FIN报文。而这两种状态的区别 是:FIN_WAIT_1状态实际上是当SOCKET在ESTABLISHED状态时,它想主动关闭连接,向对方发送了FIN报文,此时该SOCKET即 进入到FIN_WAIT_1状态。而当对方回应ACK报文后,则进入到FIN_WAIT_2状态,当然在实际的正常情况下,无论对方何种情况下,都应该马 上回应ACK报文,所以FIN_WAIT_1状态一般是比较难见到的,而FIN_WAIT_2状态还有时常常可以用netstat看到。
FIN_WAIT_2:上面已经详细解释了这种状态,实际上FIN_WAIT_2状态下的SOCKET,表示半连接,也即有一方要求close连接,但另外还告诉对方,我暂时还有点数据需要传送给你,稍后再关闭连接。

清楚原理后,我们就知道优化方式了。
方法一、加快time_wait状态回收
此部分可以通过调整内核参数完成
vi /etc/sysctl.conf

#表示开启重用,即允许将time_wait socket用于新的tcp连接。默认是关闭的
net.ipv4.tcp_tw_reuse = 1 
#表示开启time_wait的快速回收
net.ipv4.tcp_tw_recycle = 1
#表示如果套接字由本端要求关闭,这个参数决定了它保持在FIN-WAIT-2状态的时间,默认是60
net.ipv4.tcp_fin_timeout = 10

方法二、建立长连接(推荐)
短连接的方式在请求量大的时候需要频繁的进行连接的建立和回收。
长连接节省了三次握手的时间,但是比较占用服务器资源。如果每个用户建立一个长连接,那么很快就到系统瓶颈。这时候可以采用长连接复用技术。以nginx+tomcat为例。
nginx配置
nginx利用tomcat实现长连接复用keepalive_timeout与tomcat配置保持一致

upstream mysdc {
# server 127.0.0.1:8081;
        #最大失败次数 3 次 超时 10s 8080 优先 4:3
        server  127.0.0.1:8080 max_fails=3 fail_timeout=10s weight=5;
        server  127.0.0.1:8081 max_fails=3 fail_timeout=10s weight=3;
# server 127.0.0.1:8081 backup;

      # http://nginx.org/en/docs/http/ngx_http_upstream_module.html#keepalive
    # 连接到上游服务器的最大并发空闲keepalive长连接数(默认是未设置,建议与Tomcat Connector中的maxKeepAliveRequests值一样)
    # 当这个数被超过时,使用"最近最少使用算法(LUR)"来淘汰并关闭连接。
     keepalive 8000;
}

keepalive_timeout 120s 120s;

tomcat配置maxKeepAliveRequests表示每个长连接支撑多少请求,keepAliveTimeout超时时间120s

<Connector executor="tomcatThreadPool" port="8080" protocol="org.apache.coyote.http11.Http11NioProtocol" processorCache="-1" maxHttpHeaderSize="8192" maxThreads="5000" minSpareThreads="500" acceptorThreadCount="32" connectionTimeout="120000" keepAliveTimeout="120000" maxKeepAliveRequests="100" redirectPort="8443" URIEncoding="UTF-8" enableLookups="false" acceptCount="5000" disableUploadTimeout="true" />
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/132724.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 政府大数据应用案例,政府大数据治理方法[通俗易懂]

    政府大数据应用案例,政府大数据治理方法[通俗易懂]​大数据不仅将改变生产方式、生活方式,社会组织方式尤其是政府治理也将因之发生深刻变革。以大数据提升政府治理能力是大势所趋。科技革命的加速推进特别是大数据时代的到来,迫切要求政府治理加快。大数据将成为加快政府治理能力现代化的最重要、最有力推手。在大数据思维下,基于大数据的科学决策、精细管理、精准服务将成为常态,将大大推动政府管理理念和社会治理模式进步,推进法治政府、创新政府、廉洁政府、智慧政府和服务型政府建设,逐步实现治理能力现代化。政府如何利用大数据提升治理水平?1.用数据说话治理理念的转变是提高政府

    2022年6月4日
    45
  • lrzsz linux安装包,linux 离线安装lrzsz「建议收藏」

    lrzsz linux安装包,linux 离线安装lrzsz「建议收藏」安装gcc环境yuminstall–downloadonly–downloaddir=/usr/local/gccgccyuminstall–downloadonly–downloaddir=/usr/local/gcc++gcc-c++cd/usr/local/gcccd/usr/local/gcc++1.下载lrzsz-0.12.20.tar.gz2.上传压缩包到服…

    2022年6月23日
    88
  • 零基础学Java(8)数组

    零基础学Java(8)数组数组数组存储相同类型值的序列。声明数组数组是一种数据结构,用来存储同一类型值的集合。通过一个整型下标(index,或称索引)可以访问数组中的每一个值。例如,如果a是一个整型数组,a[i]就是数组

    2022年7月29日
    5
  • 什么是ADO.NET

    什么是ADO.NET

    2021年7月31日
    57
  • java深拷贝和浅拷贝_java数组copyof

    java深拷贝和浅拷贝_java数组copyof实现拷贝有几点:1)实现Cloneable接口2)重写Object类中的clone方法,并将可见性从protect改为public3)克隆需要调用super.clone(),也就是Object的实现方法浅拷贝和深拷贝的区别:浅拷贝是指拷贝对象时仅仅拷贝对象本身(包括对象中的基本变量),而不拷贝对象包含的引用指向的对象。深拷贝不仅拷贝对象本身,而且拷贝对象包含的引用指向的所有对象。以下代码说明了浅拷…

    2022年9月26日
    2
  • Spring Boot—(11)SpringBoot使用Junit单元测试

    Spring Boot—(11)SpringBoot使用Junit单元测试欢迎关注公众号:java4all摘要:本文详细的记录了SpringBoot如何结合Junit写测试用例,如何执行,打包执行,忽略执行等操作,SpringBoot内置了Junit测试组件,使用很方便,不用再单独引入其他测试组件。演示环境:SpringBoot+mybatis开发工具:IntelliJIDEA1.pom.xml一般使用idea新建一个Sp…

    2022年6月9日
    39

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号