发现大量的TIME_WAIT解决办法

发现大量的TIME_WAIT解决办法
2008-10-13 10:02:55
标签: linux  mysql  休闲  职场
原创作品,允许转载,转载时请务必以超链接形式标明文章  原始出处 、作者信息和本声明。否则将追究法律责任。 http://kerry.blog.51cto.com/172631/105233
        今天早上一上班,有同事就反映公司好几个网站都打不开,登陆数据库
服务器(windows),发现很卡,于是重启了下服务器,进入系统后,没过一会问题依旧,查看了下系统进程,发现mysql占用率达到99%,可以肯定的是mysql连接出现问题:
netstat -an
192.168.12.13:3306      192.168.12.12:30443      TIME_WAIT
192.168.12.13:3306      192.168.12.12:30444      TIME_WAIT
192.168.12.13:3306      192.168.12.12:30445      TIME_WAIT
192.168.12.13:3306      192.168.12.12:30446      TIME_WAIT
192.168.12.13:3306      192.168.12.12:30447      TIME_WAIT
192.168.12.13:3306      192.168.12.12:30448      TIME_WAIT
192.168.12.13:3306      192.168.12.12:30449      TIME_WAIT
192.168.12.13:3306      192.168.12.12:30450      TIME_WAIT
192.168.12.13:3306      192.168.12.12:30451      TIME_WAIT
192.168.12.13:3306      192.168.12.12:30452      TIME_WAIT
... ...
      根据TCP协议定义的3次握手断开连接规定,发起socket主动关闭的一方 socket将进入TIME_WAIT状态,TIME_WAIT状态将持续2个MSL(Max Segment Lifetime),在Windows下默认为4分钟,即240秒,TIME_WAIT状态下的socket不能被回收使用. 具体现象是对于一个处理大量短连接的服务器,如果是由服务器主动关闭客户端的连接,将导致服务器端存在大量的处于TIME_WAIT状态的socket, 甚至比处于Established状态下的socket多的多,严重影响服务器的处理能力,甚至耗尽可用的socket,停止服务. TIME_WAIT是TCP协议用以保证被重新分配的socket不会受到之前残留的延迟重发报文影响的机制,是必要的逻辑保证.
       在HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters,添加名为TcpTimedWaitDelay的
DWORD键,设置为60,以缩短TIME_WAIT的等待时间
 
登陆到web服务器(linux):
    
     netstat -ae |grep mysql
     tcp        0      0 aaaa:53045               192.168.12.13:mysql           TIME_WAIT   root       0
tcp        0      0 aaaa:53044               192.168.12.13:mysql           TIME_WAIT   root       0
tcp        0      0 aaaa:53051               192.168.12.13:mysql           TIME_WAIT   root       0
tcp        0      0 aaaa:53050               192.168.12.13:mysql           TIME_WAIT   root       0
tcp        0      0 aaaa:53049               192.168.12.13:mysql           TIME_WAIT   root       0
tcp        0      0 aaaa:53048               192.168.12.13:mysql           TIME_WAIT   root       0
tcp        0      0 aaaa:53055               192.168.12.13:mysql           TIME_WAIT   root       0
tcp        0      0 aaaa:53054               192.168.12.13:mysql           TIME_WAIT   root       0
tcp        0      0 aaaa:53053               192.168.12.13:mysql           TIME_WAIT   root       0
tcp        0      0 aaaa:53052               192.168.12.13:mysql           TIME_WAIT   root       0
tcp        0      0 aaaa:53059               192.168.12.13:mysql           TIME_WAIT   root       0
tcp        0      0 aaaa:53058               192.168.12.13:mysql           TIME_WAIT   root       0
tcp        0      0 aaaa:53057               192.168.12.13:mysql           TIME_WAIT   root       0
tcp        0      0 aaaa:53056               192.168.12.13:mysql           TIME_WAIT   root       0
tcp        0      0 aaaa:53063               192.168.12.13:mysql           TIME_WAIT   root       0
tcp        0      0 aaaa:53062               192.168.12.13:mysql           TIME_WAIT   root       0
tcp        0      0 aaaa:53061               192.168.12.13:mysql           TIME_WAIT   root       0
tcp        0      0 aaaa:53060               192.168.12.3:mysql           TIME_WAIT   root       0
tcp        0      0 aaaa:53067               192.168.12.13:mysql           TIME_WAIT   root       0
tcp        0      0 aaaa:53066               192.168.12.13:mysql           TIME_WAIT   root       0
tcp        0      0 aaaa:53065               192.168.12.13:mysql           TIME_WAIT   root       0
tcp        0      0 aaaa:53064               192.168.12.13:mysql           TIME_WAIT   root       0
tcp        0      0 aaaa53071               192.168.12.13:mysql           TIME_WAIT   root       0
tcp        0      0 aaaa:53070               192.168.12.13:mysql           TIME_WAIT   root       0
tcp        0      0 aaaa:53069               192.168.12.13:mysql           TIME_WAIT   root       0
发现系统存在大量TIME_WAIT状态的连接,通过调整内核参数解决,
vi /etc/sysctl.conf

编辑文件,加入以下内容:
net.ipv4.tcp_syncookies = 1
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_tw_recycle = 1
net.ipv4.tcp_fin_timeout = 30
 
然后执行  /sbin/sysctl -p 让参数生效。
 
net.ipv4.tcp_syncookies = 1 表示开启SYN Cookies。当出现SYN等待队列溢出时,启用cookies来处理,可防范少量SYN攻击,默认为0,表示关闭;

net.ipv4.tcp_tw_reuse = 1 表示开启重用。允许将TIME-WAIT sockets重新用于新的TCP连接,默认为0,表示关闭;

net.ipv4.tcp_tw_recycle = 1 表示开启TCP连接中TIME-WAIT sockets的快速回收,默认为0,表示关闭。

net.ipv4.tcp_fin_timeout 修改系統默认的 TIMEOUT 时间
 
修改之后,再用
netstat -ae|grep mysql
tcp        0      0 aaaa:50408               192.168.12.13:mysql           ESTABLISHED nobody     3224651
tcp        0      0 aaaa:50417               192.168.12.13:mysql           ESTABLISHED nobody     3224673
tcp        0      0 aaaa:50419               192.168.12.13:mysql           ESTABLISHED nobody     3224675

       发现大量的TIME_WAIT 已不存在,mysql进程的占用率很快就降下来的,各网站访问正常!!
       以上只是暂时的解决方法,最后仔细巡查发现是前天新上线的一个系统,程序代码中没有使用mysql.colse(),才导致大量的mysql  TIME_WAIT  


=====

,用ssh 远程登录系统时很慢,很久才进入到系统,进入系统后,发现负载也不是很高,就是mysql占用的资源比较多一点而已,系统运行还是正常的,认真看了一下,发现在系统中出现大量的TIME_WAIT,用netstat -talnp | grep TIME_WAIT | wc -l 一看,竟然有几千个:

 

[root@localhost ~]# netstat -talnp | grep TIME_WAIT | wc -l
3953

 

原来是mysql的端口出现了大量的 TIME_WAIT

[root@localhost ~]# netstat -an

192.168.8.8:3306      192.168.8.8:60781      TIME_WAIT

192.168.8.8:3306      192.168.8.8:60782      TIME_WAIT

192.168.8.8:3306      192.168.8.8:60783      TIME_WAIT
192.168.8.8:3306      192.168.8.8:60784      TIME_WAIT
192.168.8.8:3306      192.168.8.8:60785      TIME_WAIT
192.168.8.8:3306      192.168.8.8:60786      TIME_WAIT
192.168.8.8:3306      192.168.8.8:60787      TIME_WAIT
192.168.8.8:3306      192.168.8.8:60788      TIME_WAIT

.

.

 

  实在太多TIME_WAIT了,导致用ssh登录系统响应很慢,相信很多朋友也遇到过这种情况。

  我用以下方法解决了这个问题,TIME_WAIT变少了很多。

  通过调整内核参数:

 

net.ipv4.tcp_syncookies = 1 表示开启SYN Cookies。当出现SYN等待队列溢出时,启用cookies来处理,可防范少量SYN攻击,默认为0,表示关闭。


net.ipv4.tcp_tw_reuse = 1 表示开启重用。允许将TIME-WAIT sockets重新用于新的TCP连接,默认为0,表示关闭。

net.ipv4.tcp_tw_recycle = 1 表示开启TCP连接中TIME-WAIT sockets的快速回收,默认为0,表示关闭。

net.ipv4.tcp_fin_timeout =  60 修改系統默认的 TIMEOUT 时间
 
系统的默认值是:
 
[root@localhost ~]# sysctl -a | grep net.ipv4.tcp_syncookies
net.ipv4.tcp_syncookies = 0
[root@localhost ~]# sysctl -a | grep net.ipv4.tcp_tw_reuse
net.ipv4.tcp_tw_reuse = 0
[root@localhost ~]# sysctl -a | grep net.ipv4.tcp_tw_recycle
net.ipv4.tcp_tw_recycle = 0
[root@localhost ~]# sysctl -a | grep net.ipv4.tcp_fin_timeout
net.ipv4.tcp_fin_timeout = 60

 

我们修改为:

[root@localhost ~]# sysctl -w net.ipv4.tcp_syncookies="1"
net.ipv4.tcp_syncookies = 1

[root@localhost ~]# sysctl -w net.ipv4.tcp_tw_reuse="1"

net.ipv4.tcp_tw_reuse= 1

[root@localhost ~]# sysctl -w net.ipv4.tcp_tw_recycle="1"

sysctl -w net.ipv4.tcp_tw_recycle= 1

[root@localhost ~]# net.ipv4.tcp_fin_timeout="30"
net.ipv4.tcp_fin_timeout= 30

 

修改好后再查看一下:

[root@localhost ~]# netstat -talnp | grep TIME_WAIT | wc -l
1953
[root@localhost ~]# netstat -talnp | grep TIME_WAIT | wc -l

787
[root@localhost ~]# netstat -talnp | grep TIME_WAIT | wc -l
378
[root@localhost ~]# netstat -talnp | grep TIME_WAIT | wc -l

32

 

明显少了很多。TIME_WAIT已明显下降。

以上只是暂时的解决方法,多数是因为系统中,程序代码中没有使用mysql_close(),才导致大量的mysql  TIME_WAIT。可以参考一下方法做修改:

 

$link = mysql_connect('localhost', 'mysql_user', 'mysql_password') ;

if (!$link)

{

die(mysql_error()) ;

}

print 'You are connected';

mysql_close($link) ;

?>

阅读(317) | 评论(0) | 转发(0) |
0

上一篇:硬中断与软中断的区别

下一篇:win7点击usb图标来退出U盘无反应的解决办法

评论热议

你可能感兴趣的:(linux系统问题)