为什么主动关闭 TCP 连接的一方需要 TIME_WAIT 状态?

文章目录

  • 原因 1
  • 原因 2
  • 遗留问题
    • 问题 1
    • 问题 2
  • 为什么 TIME_WAIT 状态的持续时长是 2MSL?

主动关闭 TCP 连接的一方才有 TIME_WAIT 状态

需要 TIME_WAIT 状态,主要有两方面原因:

  1. 防止历史连接的报文(延迟的重传报文)被后面相同四元组的连接错误接收
  2. 保证「被动关闭连接」的一方,能收到对方的 ACK,也就是第四次挥手报文,正常关闭连接

原因 1

TIME_WAIT 状态持续时长 2MSL,这个时间足以让两个方向上的报文都被丢弃,使得原来连接的报文在网络中都自然消失,再出现的报文一定都是新建立的连接所产生的

原因 2

为什么主动关闭 TCP 连接的一方需要 TIME_WAIT 状态?_第1张图片
被动关闭连接的一方收到 RST 报文后,将其解释为一个错误(Connection reset by peer),这对于一个可靠的协议来说不是一种优雅的终止方式
为什么主动关闭 TCP 连接的一方需要 TIME_WAIT 状态?_第2张图片

遗留问题

RFC 1122 4.2.3.1(P96) 规定,RTO_MAX 应该小于等于 2MSL
The recommended upper and lower bounds on the RTO are known to be inadequate on large internets. The lower bound SHOULD be measured in fractions of a second (to accommodate high speed LANs) and the upper bound should be 2*MSL, i.e., 240 seconds.

问题 1

Linux 实现中,RTO_MAX > 2MSL

/* Linux Kernel 6.14.7 tcp.h */
#define TCP_RTO_MAX	((unsigned)(120*HZ))
#define TCP_FIN_TIMEOUT	TCP_TIMEWAIT_LEN
                                 /* BSD style FIN_WAIT2 deadlock breaker.
				  * It used to be 3min, new value is 60sec,
				  * to combine FIN-WAIT-2 timeout with
				  * TIME-WAIT timer.
				  */

假设一种情况,TCP 第四次挥手报文一直丢失,那么就需要反复重传(受 tcp_orphan_retries 限制)第三次挥手报文,如果其中某一次的重传报文需要等待 120s 才被发送出去,但此时对方早已退出 TIME_WAIT 处于 CLOSED 状态,与原因 1 相违背

问题 2

如果 RTO_MAX 范围是 (MSL, 2MSL],假设一种情况,TCP 第四次挥手报文一直丢失,那么就需要反复重传(受 tcp_orphan_retries 限制)第三次挥手报文,如果其中某一次的重传报文需要等待 RTO_MAX(1.01MSL) 才被发送出去,刚好此次重传报文在网络中经过 MSL 时间才到达对端,但此时对方早已退出 TIME_WAIT 处于 CLOSED 状态,与原因 1 相违背

希望有大佬看到后帮忙解答
希望有大佬看到后帮忙解答
希望有大佬看到后帮忙解答

为什么 TIME_WAIT 状态的持续时长是 2MSL?

为什么 TIME_WAIT 状态的持续时长是 2MSL?

你可能感兴趣的:(网络,网络,tcp)