linux tcp的timewait如何解决

linux tcp的timewait如何解决本文从内核的角度看timewait是如何解决的。贴代码,和网上看到的挺多冲突的!

大家好,又见面了,我是你们的朋友全栈君。

开头

本文从内核的角度看timewait是如何解决的。贴代码,和网上看到的挺多冲突的!

1. timewait是什么

timewait在tcp结束后主动关闭一方的等待时候的行为。图片中的服务和客户端描述不是非常准确,这里客户端是主动关闭一方。(在web服务器模型下,web服务器也可主动关闭客户端,这个时候web服务器就变成了四次握手的客户端)。

tcp的四次握手

2. timewait在客户端的问题

这里的客户端,不是四次握手的客户端,而是指发起tcp请求的一方。发起一方需要绑定本地端口,本地端口的绑定方式非常暴力:直接是从配置的偶数值开始遍历查找可用端口:(偶数端口和奇数端口内核的一个patch

  1. 在占用端口中,查看是否可以回收利用:如果可以回收,则返回;如果不能,继续查找下一个端口。
  2. 未被占中,直接返回

如果发起大量的客户端请求,并且不能回收,系统调用connect时长增加,甚至直接因端口耗尽直接调用失败。

int tcp_v4_connect(struct sock *sk, struct sockaddr *uaddr, int addr_len)
{ 
   
	// 本地端口绑定初始化
	err = inet_hash_connect(tcp_death_row, sk);
}

int inet_hash_connect(struct inet_timewait_death_row *death_row,
		      struct sock *sk)
{ 
   
	return __inet_hash_connect(death_row, sk, port_offset,
				   __inet_check_established);
}

// inet_hash_connect调用下面函数
int __inet_hash_connect(struct inet_timewait_death_row *death_row,
		struct sock *sk, u32 port_offset,
		int (*check_established)(struct inet_timewait_death_row *,
			struct sock *, __u16, struct inet_timewait_sock **))
{ 
   
	inet_get_local_port_range(net, &low, &high);

other_parity_scan:
	port = low + offset;
	for (i = 0; i < remaining; i += 2, port += 2) { 
   
		inet_bind_bucket_for_each(tb, &head->chain) { 
   
			if (net_eq(ib_net(tb), net) && tb->l3mdev == l3mdev &&
			    tb->port == port) { 
   
				if (tb->fastreuse >= 0 ||
				    tb->fastreuseport >= 0)
					goto next_port;
				WARN_ON(hlist_empty(&tb->owners));

				// 这里主要是调用tcp_twsk_unique,保证开启了timestamp就可以连接
				if (!check_established(death_row, sk,
						       port, &tw))
					goto ok;
				goto next_port;
			}
		}

		tb = inet_bind_bucket_create(hinfo->bind_bucket_cachep,
					     net, head, port, l3mdev);
		if (!tb) { 
   
			spin_unlock_bh(&head->lock);
			return -ENOMEM;
		}
		tb->fastreuse = -1;
		tb->fastreuseport = -1;
		goto ok;
next_port:
		spin_unlock_bh(&head->lock);
		cond_resched();
	}
}

3. timewait如何解决

端口重用的逻辑从__inet_check_established->tcp_twsk_unique(源码),总结下逻辑:

  • 当本次连接和上次四元组不同时,可以立即复用端口,不用开启任何选项 .
  • 当和上一次四元组一样时,需要满足timewait可重用条件,则可以复用,否则不能用该端口。

timewait满足的条件:

  • 开启timestamp
  • twp为null或者reuse开启时间戳满足要求;客户端的主动连接跟踪代码twp赋值为null所以天然满足。

所以需要解决timewait的客户端问题有三个办法:

  1. 上游节点分散处理,尽量保证四元祖不一样
  2. 开启timestamp
  3. 限制timewait的数量,sysctl_max_tw_buckets

timewait端口重用的逻辑:

static int __inet_check_established(struct inet_timewait_death_row *death_row,
				    struct sock *sk, __u16 lport,
				    struct inet_timewait_sock **twp)
{ 
   
	struct inet_hashinfo *hinfo = death_row->hashinfo;
	struct inet_sock *inet = inet_sk(sk);
	__be32 daddr = inet->inet_rcv_saddr;
	__be32 saddr = inet->inet_daddr;
	int dif = sk->sk_bound_dev_if;
	struct net *net = sock_net(sk);
	int sdif = l3mdev_master_ifindex_by_index(net, dif);
	INET_ADDR_COOKIE(acookie, saddr, daddr);
	const __portpair ports = INET_COMBINED_PORTS(inet->inet_dport, lport);
	unsigned int hash = inet_ehashfn(net, daddr, lport,
					 saddr, inet->inet_dport);
	struct inet_timewait_sock *tw = NULL;

	sk_nulls_for_each(sk2, node, &head->chain) { 
   
		if (sk2->sk_hash != hash)
			continue;

		if (likely(INET_MATCH(sk2, net, acookie,
					 saddr, daddr, ports, dif, sdif))) { 
   
			if (sk2->sk_state == TCP_TIME_WAIT) { 
   
				tw = inet_twsk(sk2);
			if (twsk_unique(sk, sk2, twp))
			    break;
			}
            goto not_unique;
		}
   	}

	return 0;

not_unique:
	spin_unlock(lock);
	return -EADDRNOTAVAIL;
}

static inline int twsk_unique(struct sock *sk, struct sock *sktw, void *twp)
{ 
   
	if (sk->sk_prot->twsk_prot->twsk_unique != NULL)
		return sk->sk_prot->twsk_prot->twsk_unique(sk, sktw, twp);
	return 0;
}

int tcp_twsk_unique(struct sock *sk, struct sock *sktw, void *twp)
{ 
   
	if (tcptw->tw_ts_recent_stamp &&
	    (!twp || (reuse && time_after32(ktime_get_seconds(),
					    tcptw->tw_ts_recent_stamp)))) { 
   
		if (likely(!tp->repair)) { 
   
			u32 seq = tcptw->tw_snd_nxt + 65535 + 2;

			if (!seq)
				seq = 1;
			WRITE_ONCE(tp->write_seq, seq);
			tp->rx_opt.ts_recent	   = tcptw->tw_ts_recent;
			tp->rx_opt.ts_recent_stamp = tcptw->tw_ts_recent_stamp;
		}
		sock_hold(sktw);
		return 1;
	}
}

限制timewait代码:

void tcp_fin(struct sock *sk)
{ 
   
	case TCP_FIN_WAIT2:
		/* Received a FIN -- send ACK and enter TIME_WAIT. */
		tcp_send_ack(sk);
		tcp_time_wait(sk, TCP_TIME_WAIT, 0);
		break;
}

struct inet_timewait_sock *inet_twsk_alloc(const struct sock *sk,
					   struct inet_timewait_death_row *dr,
					   const int state)
{ 
   
	struct inet_timewait_sock *tw;

	if (atomic_read(&dr->tw_count) >= dr->sysctl_max_tw_buckets)
		return NULL;
}

4 服务器端timewait有什么影响

服务器(非tcp四次握手的服务器,指如web服务器)的timewait主动端开,端口都是同一个不影响端口,但是占用机器资源。此类影响,可以从内存方面分析。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/132781.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • html css 漂亮的登录界面_登录页面怎么做

    html css 漂亮的登录界面_登录页面怎么做推荐十款好看的登录注册界面,赶紧收藏起来吧!界面一:简约版界面二界面三界面四界面五界面六界面七界面八界面九界面十

    2025年9月29日
    5
  • Kettle Spoon入门教程「建议收藏」

    Kettle Spoon入门教程「建议收藏」Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。其中,Spoon是Kettle中的一个组件,其他组件有PAN,CHEF,Encr和KITCHEN等。Spoon通过图形化的页面,方便直观的让你完成数据转换的操作。1、安装配置点我下载最新版本是7.1,小编这里使用的是6.1。下载完毕后,解压即可。因为是Java编写的,需要jdk环

    2022年5月23日
    35
  • 前端页面的简单学习与项目搭建(主要针对HTML和VUE的学习)「建议收藏」

    备注:只是本人的自学与备注,自己本身不是做前端的,只是简单搭建一些前端的东西,自己玩的。一、HTML简单的回顾(一)HTML基本结构<!DOCTYPEHTMLPUBLIC”-//W3C//DTDHTML4.01Transitional//EN””http://www.w3.org/TR/html4/loose.dtd”><html&…

    2022年4月6日
    40
  • 百度接口敏感词过滤

    百度接口敏感词过滤二话不说直接上代码//传入审核文本publicstaticfunctiontest($text){$token=self::getAccessToken();$url=’https://aip.baidubce.com/rest/2.0/solution/v1/text_censor/v2/user_defined?access_token=’.$token;$bodys=array(…

    2022年6月8日
    37
  • 树莓派 gpio usb_树莓派gpio编程

    树莓派 gpio usb_树莓派gpio编程概览树莓派最令人兴奋的特点之一是它有一个GPIO连接器可以用来接其他的硬件设备。GPIO连接器实际上是由许多不同类型的接口组成的:真正的GPIO(GeneralPurposeInputOutput,通用输入/输出)针脚,你可以用来控制LED灯的开和关。I2C(Inter-IntegratedCircuit)接口针脚,使你能够仅使用2个控制针脚连接硬件模块。SPI(SerialPeriph…

    2022年10月14日
    4
  • 遗传算法的优化算法_粒子群算法和遗传算法的区别

    遗传算法的优化算法_粒子群算法和遗传算法的区别与遗传算法的第一次接触遗传算法的基本概念基本定义遗传算法的基本流程遗传算法过程中的具体操作参数的编码二进制编码Gray编码实数编码有序编码初始群体的设定适应度函数的计算遗传操作设计选择selection交叉crossover变异mutation控制参数的设定求解优化问题的实例问题描述问题分析算法设计个体编码适应值函数选择策略杂交算子变异算子参数设置

    2025年9月16日
    7

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号