TCP系列15—重传—5、Linux中RTO的计算
之前我们介绍的都是协议中给出的RTO计算方法,下面我们看一下linux实现中RTO的计算方法。在linux中维护了srtt、mdev、mdev_max、rttvar、rtt_seq几个状态变量用来计算RTO,其中linux实现中的mdev变量相当于协议中的RTTVAR变量。rtt_seq状态变量用来控制一个RTT时间窗,linux在一个RTT时间窗内部更新状态变量的方式与RTT时间窗结束更新状态变量的方式不同,rtt_seq则用来判断当前是在RTT时间窗内部,还是一个RTT时间窗已经结束。
一、RTT时间窗的判断
几个状态变量中的rtt_seq用来判断当前采样是否处于RTT时间窗内,我们简单的说一下如何判断
在TCP窗口管理时候维护发送窗口有两个状态变量,一个是snd.una,另外一个是snd.nxt。其中snd.una表示还没有被ACK确认的数据包里面最早的系列号,snd.nxt表示下一个待发送的数据包。初始的时候设置rtt_seq =snd.nxt,随着数据包的发送和ACK报文的接收,snd.una和snd.nxt都会向前滑行,当更新RTT状态变量的时候,如果发现snd.una<=rtt_seq,说明之前发送的数据包还没有收到ACK,当前还处于RTT时间窗内部。如果发现snd.una>rtt_seq说明之前发送的数据包已经收到了对应的ACK确认,那么一个RTT时间窗结束,并把rtt_seq设置为snd.nxt继续下一个RTT时间窗的处理。
二、状态变量的更新
1、在测量到第一个RTT采样之前,linux会先查看本地缓存中是否由目标ip地址的RTT缓存信息,如果由对应的缓存信息,则会根据缓存信息初始化RTO,如果没有对应的缓存信息,则会把RTO初始化为3s。
我们可以使用ip tcp_metrics查看有所缓存,也可以使用ip tcp_metrics show ip命令查看某个ip地址相关的缓存信息
******@Inspiron:~$ ip tcp_metrics show 121.201.104.55
121.201.104.55 age 56.604sec cwnd 10 rtt 461481us rttvar 461481us source 192.168.1.103
srtt = m
mddev = m/2
rttvar = max(mdev, min_rto)
mdev_max = rttvar
RTO = srtt + 4 * rttvar
其中min_rto为该目标地址的最小RTT,如果路由中有配置那么使用配置值,如果没有配置则使用TCP_RTO_MIN,TCP_RTO_MIN常量为50ms(linux代码中这个常量为200ms实际为放大四倍后的值)。
3、在随后再次收到RTT测量值m的时候,按照如下更新mdev
if(m < (srtt - mdev))
mdev = (31/32) * mdev + (1/32) * |srtt - m|
else
mdev = (3/4) * mdev + (1/4) * |srtt - m|
我们之前说过linux实现中mdev变量相当于协议中的RTTVAR变量,这里mdev的更新与协议有了明显的不同,主要原因是如果链路时延突然大幅降低的时候,如果按照协议方法更新反而会大幅增加最后的RTO,因此linux在发现链路时延大幅下降的时候会降低RTO增长的幅度。其他状态变量更新如下
mdev_max = max(mdev_max, mdev)
- srtt = (7/8) * srtt + (1/8) * m
- rttvar = mdev_max
- RTO = srtt + 4 * rttvar
4、根据rtt_seq来判断如果当前是RTT时间窗结束,则执行如下流程
if(mdev_max < rtt_var)
{
rtt_var = (3/4) * rtt_var + (1/4) * mdev_max
}
mdev_max = min_rto
补充说明:
1、linux中在测量到第一个RTT采样之前RTO的初始化参考tcp_init_metrics,RTT相关状态变量的更新参考tcp_rtt_estimator,其中mdev放大4倍,srtt放大8倍进行的保存和计算。