如何解决服务器网络压力下远程ssh心跳超时问题

问题

postgresql故障节点rewind过程,主备节点间存在大量的数据传输,此时主机节点ssh备机节点可能会出现心跳超时断开问题:

类似问题:

ssh 远程执行命令慢(debug2: channel 0: open confirm rwindow 0 rmax 32768)

出现的服务器:dell R740 :KYLIN V10

分析

网卡bufferfloat满载,小包可能会发不出去

解决

方法一(当前生效):

tc qdisk replace dev em1 root fq_codel

注:此方法重启系统后会失效

方法二(永久生效):

1、echo 'net.core.default_qdisk=fq_codel' >>/etc/sysctl.conf

2、重启服务器

 

查询是否生效

tc qdisc show dev eth0

结果如下表示生效:

qdisc fq_codel 0: root refcnt 2 limit 10240p flows 1024 quantum 1514 target 5ms interval 100ms memory_limit 32Mb ecn drop_batch 64

 

posted @ 2021-07-08 20:23  明矾  阅读(232)  评论(0编辑  收藏  举报