问题背景:
最近做C/S结构的程序,项目中需要开发TCP服务器端,需要能够接收多个客户端的连接请求。开发完成后,测试过程中出现了如题问题。
问题描述:
启动服务器,开启多个客户端,建立连接通讯,一切正常。关闭客户端(一个或多个),此时用netstat命令查看网络状态,发现所关闭的客户端的连接没有完全释放,而是处于CLOSE_WAIT状态。
解决方法:
MSDN中获取当前的连接状态的说明如下:
Connected 属性的值反映最近操作时的连接状态。如果您需要确定连接的当前状态,请进行非阻止、零字节的 Send 调用。如果该调用成功返回或引发 WAEWOULDBLOCK 错误代码 (10035),则该套接字仍然处于连接状态;否则,该套接字不再处于连接状态。
经测试测方法并不能准确的获取到当前连接的状态。(环境:windows xp sp3,.Net framework 3.5)。测试发现每次关闭客户端后异步接受的返回值都零字节(我使用的是异步接收数据),因此就依据这一条件判断连接是否断开,即接收的字节为零则断开连接。经过测试此种方式确实可以对客户程序的退出作出及时的响应,本以为问题到此已经解决了,但是对另一种客户端断开方式——网线断开,还是不能及时地作出响应。搜索相关问题,找到参考文章(http://tech.it168.com/msoft/2008-01-31/200801311356430.shtml)。,有如下描述:
【引用参考】我们知道,TCP有一个连接检测机制,就是如果在指定的时间内(一般为2个小时)没有数据传送,会给对端发送一个Keep-Alive数据报,使用的序列号是曾经发出的最后一个报文的最后一个字节的序列号,对端如果收到这个数据,回送一个TCP的ACK,确认这个字节已经收到,这样就知道此连接没有被断开。如果一段时间没有收到对方的响应,会进行重试,重试几次后,向对端发一个reset,然后将连接断掉。
在Windows中,第一次探测是在最后一次数据发送的两个小时,然后每隔1秒探测一次,一共探测5次,如果5次都没有收到回应的话,就会断开这个连接。但两个小时对于我们的项目来说显然太长了。我们必须缩短这个时间。那么我们该如何做呢?我要利用Socket类的IOControl()函数。我们来看看这个函数能干些什么:
使用 IOControlCode 枚举指定控制代码,为 Socket 设置低级操作模式。 【引用参考】
MSDN中IOControlCode的说明:为 Socket 设置低级别操作模式。两个重载如下:
1、IOControl(Int32, array
2、IOControl(IOControlCode, array
我们采用第二种重载。
首先需要弄清参数的意义。
【引用参考】
在C++里它是一个结构体。我们来看看这个结构体:
struct tcp_keepalive
{
u_long onoff; //是否启用Keep-Alive
u_long keepalivetime; //多长时间后开始第一次探测(单位:毫秒)
u_long keepaliveinterval; //探测时间间隔(单位:毫秒)
};
在C#中,我们直接用一个Byte数组传递给函数:
uint dummy = 0;
byte[] inOptionValues = new byte[Marshal.SizeOf(dummy) * 3];
BitConverter.GetBytes((uint)1).CopyTo(inOptionValues, 0);//是否启用Keep-Alive
BitConverter.GetBytes((uint)5000).CopyTo(inOptionValues, Marshal.SizeOf(dummy));//多长时间开始第一次探测
BitConverter.GetBytes((uint)5000).CopyTo(inOptionValues, Marshal.SizeOf(dummy) * 2);//探测时间间隔
【引用参考】
结合以上两种种方法,服务器端对网络连接的断开都能作出及时的响应,至此问题解决。
如果其中有描述不清楚或不正确的地方,望不吝赐教。
参考:
1、http://tech.it168.com/msoft/2008-01-31/200801311356430.shtml