本文转载自微信公众号「小菜学编程」,作者fasionchan。转载本文请联系小菜学编程公众号。
上一小节,我们通过一个实验,深入地研究了 TCP 三次握手建立连接的过程。
我们退出 telnet 命令后,TCP 将关闭连接。于此同时,我们通过 tcpdump 也观察到 TCP 关闭连接的通信过程。本节,我们继续深入研究 TCP 关闭连接的通信细节。
上节实验中的通信过程,已经被抓包并保存起来,我们直接用 tcpdump 命令将其打开( tcp.pcap ):
- root@client[~]➜tcpdump-nrtcp.pcap
- readingfromfiletcp.pcap,link-typeLINUX_SLL(Linuxcookedv1)
- 17:31:57.624391ARP,Requestwho-has10.0.0.2tell10.0.0.3,length28
- 17:31:57.624439ARP,Reply10.0.0.2is-at0e:bd:60:1c:69:9d,length28
- 17:31:57.624450IP10.0.0.3.55692>10.0.0.2.22:Flags[S],seq386101196,win29200,options[mss1460,sackOK,TSval811948031ecr0,nop,wscale7],length0
- 17:31:57.624495IP10.0.0.2.22>10.0.0.3.55692:Flags[S.],seq1155103769,ack386101197,win28960,options[mss1460,sackOK,TSval3541712191ecr811948031,nop,wscale7],length0
- 17:31:57.624522IP10.0.0.3.55692>10.0.0.2.22:Flags[.],ack1,win229,options[nop,nop,TSval811948031ecr3541712191],length0
- 17:31:57.635739IP10.0.0.2.22>10.0.0.3.55692:Flags[P.],seq1:42,ack1,win227,options[nop,nop,TSval3541712202ecr811948031],length41
- 17:31:57.635778IP10.0.0.3.55692>10.0.0.2.22:Flags[.],ack42,win229,options[nop,nop,TSval811948042ecr3541712202],length0
- 17:31:59.808411IP10.0.0.3.55692>10.0.0.2.22:Flags[F.],seq1,ack42,win229,options[nop,nop,TSval811950215ecr3541712202],length0
- 17:31:59.809175IP10.0.0.2.22>10.0.0.3.55692:Flags[.],ack2,win227,options[nop,nop,TSval3541714376ecr811950215],length0
- 17:31:59.809464IP10.0.0.2.22>10.0.0.3.55692:Flags[F.],seq42,ack2,win227,options[nop,nop,TSval3541714376ecr811950215],length0
- 17:31:59.809483IP10.0.0.3.55692>10.0.0.2.22:Flags[.],ack43,win229,options[nop,nop,TSval811950216ecr3541714376],length0
很显然,最后四个包就是四次挥手关闭连接的过程:
当我们按下 Ctrl-D 退出 telnet 命令时,客户机向服务器发出一个 FIN 包。这是一个设置了 FIN 标志位的 TCP 分组,它告诉服务器,客户机这端的数据已经发完,准备关闭连接:
服务器收到 FIN 包后,将回复一个 ACK 进行确认。注意到,确认号在 FIN 包序号的基础上加一,因为 FIN 也要占用一个序号,跟 SYN 一样。
于此同时,服务器将连接读端关闭的情况通知上层应用程序—— SSH 服务进程。至此,TCP 连接中从客户机到服务器的传输方向已经关闭,连接处于 半关闭 状态。
上图灰色部分就是其中已关闭的传输方向,它对客户机来说是 写端 ,对服务器来说是 读端 。另一个方向的数据传输仍可正常进行,因此服务器可以继续发送数据(写端),客户机也可以接收服务器发来的数据(读端)。
SSH 服务进程获悉客户机关闭连接后,便准备结束服务并关闭连接。如果这时它还有数据没发完,仍可通过半开连接发往客户机。等所有数据都发送完毕,服务器同样发送 FIN 分组,告诉客户端连接关闭。
一个 TCP 连接包含两个方向的传输通道,因此需要两对 FIN/ACK 分组,各自负责关闭对应的方向。因此,这两对 FIN/ACK 交互也被形象地称为 四次挥手 。
状态变迁
TCP 建立连接需要三次握手,关闭连接需要四次挥手,步骤相对繁琐。这意味着一个 TCP 连接应该有很多中间状态,接下来我们深入研究一下:
上图是 TCP 连接全生命周期时序图,左边是客户端的时间轴,右边是服务端的时间轴。时间轴上的不同颜色,则分别表示客户端和服务端连接所处的状态:
- 客户端发出 SYN 分组,连接进入 SYN_SENT 状态;
- 服务端收到客户端发来的 SYN 分组,它回复 SYN/ACK 分组,连接进入 SYN_RECV 状态;
- 客户端收到服务器的 SYN/ACK 分组,它回复 ACK 分组,连接进入 ESTABLISHED 状态;
- 服务器收到客户端的 ACK 分组,服务端连接也进入 ESTABLISHED 状态;
- 当连接处于 ESTABLISHED 状态时,客户端和服务端可以互相传输数据;
- 时序图中间的数据分组及其后的 ACK 分组,为实验中 SSH 服务向客户机返回自己的版本信息(这部分数据被 telnet 命令直接输出到屏幕中);
- 客户端准备退出时,它通过 FIN 分组通知服务端,连接进入 FIN_WAIT1 状态;
- 服务器收到客户端发来的 FIN 分组,它回复 ACK 分组进行确认,连接进入 CLOSE_WAIT 状态;
- 客户端收到服务器发来的 ACK 分组,连接进入 FIN_WAIT2 状态;
- 这时连接处于半关闭状态,服务器仍可以向客户端发送数据;
- 服务器发完剩余数据后,向客户端发送 FIN 分组,通知客户端关闭连接,服务端连接便进入 LAST_ACK 状态;
- 客户端收到服务器发来的 FIN 分组,回复 ACK 分组进行确认,客户端连接进行 TIME_WAIT 状态;
- 服务端收到 ACK 分组后,连接彻底关闭;
- 由于最后一个 ACK 分组可能会丢,客户端必须在 TIME_WAIT 状态等待一段时间,以便对服务器重传的 FIN 分组进行确认;
至此,我们可以得到一个完整的 TCP 状态变迁图:
TCP 主动连接方(客户端)和被动连接方(服务端)的状态变迁路径是不一样的:图中的绿色路径是客户端正常情况的状态变迁路径;而红色路径是服务端正常情况下的变迁路径。从图中可以看到,主动关闭方的状态变迁,也比被动关闭方要复杂得多。
根据 TCP/IP详解 的介绍,TCP 协议也支持从服务端发起建立连接。但由于这种实现实际上非常罕见,这里就不作深入介绍了。
状态变迁是 TCP 协议的一个重要知识点,特别是对 TIME_WAIT 状态的理解,在后端技术面试中经常考察。
TIME_WAIT 状态
TCP 主动关闭方最终会进入 TIME_WAIT 状态,并维持 2MSL 时长,为什么呢?
如上图,假设四次挥手中最后一个 ACK 分组在网络中丢失了,会发生什么事情呢?这时被动关闭的服务端会重传 FIN 分组。因此主动关闭方不能直接关闭,而应该在 TIME_WAIT 状态下维持一段时间,以便向重传的 FIN 分组回复 ACK 分组。否则对端仍会重传 FIN 分组,并在重试若干次后放弃,这时连接只能异常关闭。
另一方面,一个 TCP 连接由通信双方的 IP 地址和端口组成的四元组唯一确定。如果主动关闭方不在 TIME_WAIT 状态下等待一段时间,而是快速关闭释放资源,又会发生什么事情呢?这时原来的四元组有可能被新的连接复用,而旧连接重传的 FIN 分组可能因网络原因延迟到达,最终对新连接产生冲突干扰。
那么,为什么是维持 TIME_WAIT 状态 2MSL 时长呢?
MSL 是最大分组寿命( maximum segment lifetime )的简称,即一个 TCP 分组被丢弃前能够在网络中存在的最长时间。这个时间肯定是有限的,因为负责传输 TCP 分组的 IP 包中有限制存活时间的 TTL 字段。由于 IP 包对存活时间的限制是基于跳数的,因此两者不对等。不同的网络协议栈实现,MSL的取值也不尽相同:30秒、1分钟或2分钟都有。
将 TIME_WAIT 状态维持 2MSL 时长是出于这样的考虑:
假设最后一个 ACK 分组刚好在存活时间耗尽前到达对端主机,这时已经过了 MSL 时间。对端收到 ACK 后,就会立即关闭连接,不可能再发送 FIN 分组。但如果对端在收到 ACK 前刚刚重传了 FIN 分组,就必须再经过 MSL 时间才能保证 FIN 分组从网络中消失。因此,连接必须维持 TIME_WAIT 状态 2MSL 时间后才能释放,否则就可能对潜在的新连接造成干扰。
你可能会问,如果最后一个 ACK 分组丢了,对端不是还会继续重传 FIN 分组吗?不用再继续等待 FIN 失效吗?
是的,对端肯定会重传 FIN 分组,而且通常 很快 就开始重传。MSL 一般是几十秒,而网络往返时间要小得多,通常只是毫秒级,TCP 重传时间数量级也是差不多。因此,在 MSL 时间内,TCP 可以重传 FIN 分组好几次了!如果其中有一个 FIN 分组可以到达,TCP 会重置定时器,将 TIME_WAIT 状态再维持 2MSL 时长。如果几个 FIN 分组都丢了,那再等下去也没啥意义了!
- 如果最后一个 ACK 分组可以到达对端,最多只需要等待 2MSL 时间即可保证网络中没有对端重传的 FIN 分组;
-
如果最后一个 ACK 分组丢失了,对端在 MSL 内已经重传 好多次 了;
- 如果重传的 FIN 分组有一个可以到达本端,TCP 回复 ACK 后会重置定时器在 TIME_WAIT 继续等待 2MSL 时长;
- 如果重传的 FIN 分组都丢了,说明网络质量很差,再等下去也没有意义了;
因此,主动关闭方收到对端 FIN 分组后,必须在 TIME_WAIT 状态等待 2MSL ,才能释放连接。这样既保证对重传 FIN 分组的回复,又保证重传的 FIN 分组从网络中消失,不会对复用四元组的新连接造成冲突干扰。
主动关闭方一般是客户端,并发一般不高,因此 TIME_WAIT 状态基本不会造成任何影响。如果一个高并发服务(比如 Web 服务)存在大量短连接,则可能留下很多 TIME_WAIT 状态的连接。由于 TIME_WAIT 状态套接字无法立即回收,它们将占用大量的系统资源,对服务的性能造成严重影响。
这时,系统管理员可以选择系统的 2MSL 时长适当调短,加快 TIME_WAIT 连接的清理速度。此外,在 Linux 系统中,可以开启 tcp_tw_recycle 和 tcp_tw_reuse 内核选项,以复用 TIME_WAIT 状态的套接字。这些属于 TCP 和系统调优的范畴,后续有机会再专门展开介绍。
原文链接:https://mp.weixin.qq.com/s/NjjMzzktGGnkdI3mzjRkog