1. 建立tcp连接时,server端使用的端口号和listen port的关系
tcp连接是一个4元组:[clientIP, clientPort, serverIP, serverPort],四个元素中有一个元素不同,就是一个不同的tcp连接。以ssh为例,监听在22端口,不同的client连接过来,四元组中server部分都是[server_ip, 22]
>>>
tcp 0 0 192.168.66.154:22 192.168.66.78:45638 ESTABLISHED
tcp 0 52 192.168.66.154:22 192.168.65.57:57719 ESTABLISHED
>>>

2. 防火墙只允许listen port上的数据经过,会对(1)中的情况有什么影响
如果防火墙只允许22端口通过,由于(1)中的结论,不会有影响。

3. tcp阻塞式的send()有没有超时,如何设置超时时间
"man tcp"文档里面 TCP_USER_TIMEOUT (since Linux 2.6.37) 项写道:
failure may take up to 20 minutes with the current system defaults in a normal WAN environment
这个时间为数据包被发送后未接收到ACK确认的最大时长,从这里看出,默认的send超时为20分钟。
额外的,keepalive相关的配置:
tcp_keepalive_intvl (integer; default: 75; since Linux 2.4)
The number of seconds between TCP keep-alive probes.
tcp_keepalive_probes (integer; default: 9; since Linux 2.2)
The maximum number of TCP keep-alive probes to send before giving up and killing the connection if no response is obtained from the other end.
tcp_keepalive_time (integer; default: 7200; since Linux 2.2)
The number of seconds a connection needs to be idle before TCP begins sending out keep-alive probes.
默认时间超长。
另外,阻塞式的recv()默认没有时间限制,会一直等待。
需要注意的点:线路忙碌(丢包)和对方一直不recv消息是两回事(参考https://blog.cloudflare.com/when-tcp-sockets-refuse-to-die/)
一直不recv消息是不会触发send()超时的。

4. 如果阻塞在send()时,把网络断了,会有什么影响
应该不会有影响,因为tcp是不知道网络断了的,除非有额外的心跳协议,程序会一直阻塞在send()直到超时。

5. tcp发送缓冲区大小和tx buffer的关系
大部分网卡都支持多队列模式,每个队列在内存中会有一个对应的TX/RX环形缓冲区,而且这个TX/RX是可以被DMA操控的。发送数据时,先从用户缓冲区拷贝到内核skb缓冲区。然后经过一系列处理(可能会有拷贝发生),再通过DMA映射,把skb地址映射到TX队列中,然后由网卡发送出去。

6. tcp什么时候产生RST
RST表示复位,用来异常的关闭连接,区别于正常的四次握手关闭。
(1) 目的地为某端口的SYN到达,然而在该端口上并没有正在监听的服务器。没有listen,但是收到连接SYN请求
(2) TCP想取消一个已有连接。正常情况FIN会在缓冲区数据发送完之后再发送,通过套接字选项SO_LINGER的数值设置为0,可以直接丢弃数据,并发送RST给对方。
(3) TCP接收到一个根本不存在的连接上的分节。
引申情况:
SIGPIPE信号:连接建立,若某一端关闭连接,而另一端仍然向它写数据,第一次写数据后会收到RST响应,此后再写数据,内核将向进程发出SIGPIPE信号,通知进程此连接已经断开。而SIGPIPE信号的默认处理是终止程序

7. 测试tcp多个client端绑定同一个port,但是四元组不同
应用场景,某台机器防火墙只允许一个端口收发进出数据,需要从一个端口对外发起多个连接。
通过设置SO_REUSEADDR选项实现,以下只针对tcp,udp没测过:
(a)当local address被一个处于listen状态的socket使用时,加上该参数也不能重用这个地址(地址=[ip, port])
(b)两个进程可以绑定相同的本地地址,只要四元组不同就可以。
引申情况:
TCP的”TIME_WAIT“状态 ---- 持续大约2MSL(60秒),为了进一步提高tcp的可靠性。
存在理由有:
(1) 可靠地实现TCP全双工连接的终止。如果最后的ACK丢失,对方重传FIN,如果不维持这个状态信息,那么客户端将响应RST分节,对方将此分节解释成一个错误。
(2) 允许老的重复分节在网络中消逝。有可能出现这种情况,前一个连接的迷途重复分组在前一个连接终止后出现,从而被误解成从属于新的化身(这个概率非常小,因为新连接的起始序列号是随机的)。
可以看出TIME_WAIT状态单纯是为了增加可靠性。大多数时候,在TIME_WAIT状态内,程序都是无事可做,只有少数时候会收到对方重发的FIN然后返回ACK。如果对网络和程序有信息,完全可以使用SO_REUSEADDR选项忽略TIME_WAIT,是的新的连接直接使用已关闭的端口。
时间长度选择2MSL,也是考虑到一个网络包来回的最长时间,1个网络包能存活1MSL时间,来回就是2MSL。超过这个时间,基本就能假设没有丢包。为什么不是更长呢?因为没法做到100%,只能选一个相对合理的时长。

8. 路由器限流原理以及方法
一般都是直接把包丢弃,有的是在ip层,有的是tcp层,也有直接链路层。

9. udp调用sendto函数会不会有报错的情况
如果写入过快,会有error,但是具体没测试,可能会阻塞,也可能返回EWOULDBLOCK/EAGAIN。
本质上对数据发送来说,是对协议透明的,因为缓冲区是有限的,所以只要数据写入速度大于网卡发送速度,缓冲区迟早会满。缓冲区满了之后的处理由操作系统决定。而tcp重传这些,也是内核的处理,不会阻碍缓冲区填满。

10. 网卡收到数据,但是不及时取走,会怎么样?
当 NIC 把数据包通过 DMA 复制到内核缓冲区 sk_buffer 后,NIC 立即发起一个硬件中断。CPU 接收后,首先进入上半部分,网卡中断对应的中断处理程序是网卡驱动程序的一部分,之后由它发起软中断,进入下半部分,开始消费 sk_buffer 中的数据,交给内核协议栈处理。
当驱动处理速度跟不上网卡收包速度时,驱动来不及分配缓冲区,NIC 接收到的数据包无法及时写到 sk_buffer,就会产生堆积,当 NIC 内部缓冲区写满后,就会丢弃部分数据,引起丢包。这部分丢包为 rx_fifo_errors,在 /proc/net/dev 中体现为 fifo 字段增长,在 ifconfig 中体现为 overruns 指标增长。
(内核通常需要快速的拷贝网络数据包到系统内存,因为网卡上接收网络数据包的缓存大小固定,而且相比系统内存也要小得多。所以上述拷贝动作一旦被延迟,必然造成网卡FIFO缓存溢出 - 进入的数据包占满了网卡的缓存,后续的包只能被丢弃,这也应该就是ifconfig里的overrun的来源。)

posted on 2021-07-09 16:30  SimbaStar  阅读(616)  评论(0编辑  收藏  举报