监测CentOS下TCP断线

TCP正常的断开,通信双方(服务端和客户端)都是能知道的。但是非正常的断开,比如直接拔掉了网线,就只能靠如下两种方法,实现短时间内的检测。

一、心跳包机制
心跳包机制,是网游设计中的常用机制。从用户层面,自己发包去判断对方连线状态。可以根据情况,很灵活的使用。比如,20秒发送一个最小的数据包(也可以根据实际情况稍带一些其他数据)。如果发送没有回应,就判断对方掉线了。

二、利用tcp_keepalive机制
利用TCP的机制,通过设置系统参数,从系统层面,监测tcp的连接状态。以下为linux下的方法:
1、首先查看系统tcp_keepalive相关参数(centos和Ubuntu)
    # sysctl -a|grep tcp_keepalive
    显示如下:
    net.ipv4.tcp_keepalive_intvl = 75
    net.ipv4.tcp_keepalive_probes = 9
    net.ipv4.tcp_keepalive_time = 7200
    分别说一下这三个参数:
    tcp_keepalive_time 参数:
    是指TCP发送keepalive消息的频度,默认为7200秒,也就是两个小时。
    keepalive_intvl 参数:
    当探测没有确认时,重新发送探测的频度。默认是75秒。
    keepalive_probes 参数:
    在认定连接失效之前,发送多少个TCP的keepalive探测包。默认值是9次。

2、修改系统的tcp_keepalive相关参数
    在知道以上三个系统参数的定义和作用之后,我们来修改一下这三个参数:
    修改/etc/sysctl.conf文件:
    # vi /etc/sysctl.conf
    在打开的文件中,加入如下三行:
    net.ipv4.tcp_keepalive_intvl = 1
    net.ipv4.tcp_keepalive_probes = 1
    net.ipv4.tcp_keepalive_time = 5
    保存文件。

3、重启服务器
    # reboot
    附注:或者临时使系统设置生效也行:# sysctl -p

4、修改程序代码部分。
    注意:仅仅配置内核参数是不够的,还必须在编程的时候设置套接字的选项,调用函数是
    socket.setsockopt(level, optname, value) 
    示例:
    level为SOL_SOCKET的话,选项为SO_KEEPALIVE,值为布尔。
    socket.setsockopt(socket.SOL_SOCKET, socket.SO_KEEPALIVE, True)  
    此外还可以设置TCP选项(设置的level为SOL_TCP而不是SOL_SOCKET)覆盖系统全局设置
    TCP_KEEPCNT  与tcp_keepalive_probes 对应
    TCP_KEEPIDLE 与tcp_keepalive_time 对应
    TCP_KEEPINTVL 与tcp_keepalive_intvl 对应

 

posted @ 2017-03-16 22:13  Earic  阅读(1256)  评论(0编辑  收藏  举报