Linux 网络协议栈是根据 TCP/IP 模型来实现的,TCP/IP 模型由应用层、传输层、网络层和网络接口层,共四层组成,每一层都有各自的职责。

应用程序要发送数据包时,通常是通过 socket 接口,于是就会发生系统调用,把应用层的数据拷贝到内核里的 socket 层,接着由网络协议栈从上到下逐层处理后,最后才会送到网卡发送出去。

而对于接收网络包时,同样也要经过网络协议逐层处理,不过处理的方向与发送数据时是相反的,也就是从下到上的逐层处理,最后才送到应用程序。

网络的速度往往跟用户体验是挂钩的,那我们又该用什么指标来衡量 Linux 的网络性能呢?以及如何分析网络问题呢?

网络性能指标

通常是以4个指标来衡量网络的性能,分别是带宽、延时、吞吐率、PPS(Packet Per Second),它们表示的意义如下:

  • 带宽,表示链路的最大传输速率,单位是 b/s(比特/秒),带宽越大,其传输能力就越强。
  • 延时,表示请求数据包发送后,收到对端响应,所需要的时间延迟。不同的场景有着不同的含义,比如可以表示建立 TCP 连接所需的时间延迟,或一个数据包往返所需的时间延迟。
  • 吞吐率,表示单位时间内成功传输的数据量,单位是 b/s(比特/秒)或者 B/s(字节/秒),吞吐受带宽限制,带宽越大,吞吐率的上限才可能越高。
  • PPS,全称是 Packet Per Second(包/秒),表示以网络包为单位的传输速率,一般用来评估系统对于网络的转发能力。

当然,除了以上这四种基本的指标,还有一些其他常用的性能指标,比如:

  • 网络的可用性,表示网络能否正常通信;
  • 并发连接数,表示 TCP 连接数量;
  • 丢包率,表示所丢失数据包数量占所发送数据组的比率;
  • 重传率,表示重传网络包的比例;

查看网络配置

要想知道网络的配置和状态,我们可以使用 ifconfig 或者 ip 命令来查看。这两个命令功能都差不多,不过它们属于不同的软件包,ifconfig 属于 net-tools软件包, ip 属于 iproute2 软件包,我的印象中 net-tools 软件包没有人继续维护了,而 iproute2 软件包是有开发者依然在维护,所以更推荐你使用 ip 工具。
学以致用,那就来使用这两个命令,来查看网口 eth0 的配置等信息:

# ifconfig eth0 
eth0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
        inet 172.16.108.119  netmask 255.255.255.0  broadcast 172.16.108.255
        inet6 fe80::5054:ff:fe38:e642  prefixlen 64  scopeid 0x20<link>
        ether 52:54:00:38:e6:42  txqueuelen 1000  (Ethernet)
        RX packets 215198056  bytes 21032436157 (19.5 GiB)
        RX errors 0  dropped 0  overruns 0  frame 0
        TX packets 138828601  bytes 15573459510 (14.5 GiB)
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0

# ip -s addr show dev eth0
2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP group default qlen 1000
    link/ether 52:54:00:38:e6:42 brd ff:ff:ff:ff:ff:ff
    inet 172.16.108.119/24 brd 172.16.108.255 scope global noprefixroute eth0
       valid_lft forever preferred_lft forever
    inet6 fe80::5054:ff:fe38:e642/64 scope link 
       valid_lft forever preferred_lft forever
    RX: bytes  packets  errors  dropped overrun mcast   
    21032460596 215198294 0       0       0       0       
    TX: bytes  packets  errors  dropped carrier collsns 
    15573475739 138828738 0       0       0       0 

虽然这两个命令输出的格式不尽相同,但是输出的内容基本相同,比如都包含了 IP 地址、子网掩码、MAC 地址、网关地址、MTU 大小、网口的状态以及网络包收发的统计信息,下面就来说说这些信息,它们都与网络性能有一定的关系。

第一,网口的连接状态标志。其实也就是表示对应的网口是否连接到交换机或路由器等设备,如果ifconfig输出中看到有RUNNING,或者ip输出中有 LOWER UP,则说明物理网络是连通的,如果看不到,则表示网口没有接网线。

第二,MTU 大小。默认值是 1500 字节,其作用主要是限制网络包的大小,如果 IP 层有一个数据报要传,而且网络包的长度比链路层的 MTU 还大,那么IP 层就需要进行分片,即把数据报分成若干片,这样每一片就都小于 MTU。事实上,每个网络的链路层 MTU 可能会不一样,所以你可能需要调大或者调小MTU 的数值。

第三,网口的IP 地址、子网掩码、MAC地址、网关地址。这些信息必须要配置正确,网络功能才能正常工作。

第四,网络包收发的统计信息。通常有网络收发的字节数、包数、错误数以及丢包情况的信息,如果 X(发送)和RX(接收)部分中 errors、dropped、overruns、carrier 以及 colisions 等指标不为0时则说明网络发送或者接收出问题了,这些出错统计信息的指标意义如下:

  • errors 表示发生错误的数据包数,比如校验错误、帧同步错误等;
  • dropped 表示丢弃的数据包数,即数据包已经收到了 Ring Buffer(这个缓冲区是在内核内存中,更具体一点是在网卡驱动程序里),但因为系统内存不足等原因而发生的丢包;
  • overruns 表示超限数据包数,即网络接收/发送速度过快,导致 Ring Buffer 中的数据包来不及处理,而导致的丢包,因为过多的数据包挤压在 Ring Buffer,这样 Ring Buffer 很容易就溢出了;
  • carrier 表示发生 carrirer 错误的数据包数,比如双工模式不匹配、物理电缆出现问题等;
  • collisions 表示冲突、碰撞数据包数;

ifconfig 和 ip 命令只显示的是网口的配置以及收发数据包的统计信息,而看不到协议栈里的信息那接下来就来看看如何查看协议栈里的信息。

查看socket信息

我们可以使用netstat或者ss,这两个命令查看socket、网络协议栈、网口以及路由表的信息。

虽然 netstat 与 ss 命令查看的信息都差不多,但是如果在生产环境中要查看这类信息的时候,尽量不要使用 netstat 命令,因为它的性能不好,在系统比较繁忙的情况下,如果频繁使用 netstat 命令则会对性能的开销雪上加霜,所以更推荐你使用性能更好的ss命令。
从下面这张图,你可以看到这两个命令的输出内容:

# -n表示不显示名字,而是以数字方式显示ip和端口
# -l表示只显示LISTEN状态的socket
# -p表示显示进程信息

# netstat -nlp
Active Internet connections (only servers)
Proto Recv-Q Send-Q Local Address           Foreign Address         State       PID/Program name    
tcp        0      0 0.0.0.0:22              0.0.0.0:*               LISTEN      842/sshd 



# -l 表示只显示Listen状态的socket
# -t 表示只显示tcp连接
# -n 表示不显示名字,而是以数字方式显示ip和端口
# -p 表示显示进程信息

# ss -ltnp
State      Recv-Q Send-Q                                                Local Address:Port                                                               Peer Address:Port              
LISTEN     0      128                                                               *:22                                                                            *:*                   users:(("sshd",pid=842,fd=3))

可以发现,输出的内容都差不多,比如都包含了socket的状态(State)、接收队列(Recv-Q)、发送队列(Send-Q)、本地地址(Local Address)、远端地址(Foreign Address)、进程 PID 和进程名称(PID/Program name)等。

接收队列(Recv-Q)和发送队列(Send-Q)比较特殊,在不同的 socket 状态。它们表示的含义是不同的。
当socket状态处于Established时:

  • Recv-0 表示 socket 缓冲区中还没有被应用程序读取的字节数;
  • Send-0 表示 socket 缓冲区中还没有被远端主机确认的字节数;

而当socket状态处于Listen时:

  • Recv-0 表示全连接队列的长度;
  • Send-Q 表示全连接队列的最大长度;
    在 TCP 三次握手过程中,当服务器收到客户端的 SYN 包后,内核会把该连接存储到半连接队列,然后再向客户端发送 SYN+ACK 包,接着客户端会返回 ACK,服务端收到第三次握手的 ACK后,内核会把连接从半连接队列移除,然后创建新的完全的连接,并将其增加到全连接队列,等待进程调用accept()函数时把连接取出来。

也就说,全连接队列指的是服务器与客户端完了TCP 三次握手后,还没有被 accept()系统调用取走连接的队列。那对于协议栈的统计信息,依然还是使用netstat或ss,它们查看统计信息的命令如下:

# netstat -s
Ip:
    194576101 total packets received
    18621 forwarded
    0 incoming packets discarded
    141746242 incoming packets delivered
    136457468 requests sent out
Icmp:
    679 ICMP messages received
    0 input ICMP message failed.
    ICMP input histogram:
        destination unreachable: 339
        timeout in transit: 9
        echo requests: 18
        echo replies: 313
    1044 ICMP messages sent
    0 ICMP messages failed
    ICMP output histogram:
        destination unreachable: 374
        echo request: 652
        echo replies: 18
IcmpMsg:
        InType0: 313
        InType3: 339
        InType8: 18
        InType11: 9
        OutType0: 18
        OutType3: 374
        OutType8: 652
Tcp:
    1101687 active connections openings
    22388262 passive connection openings
    65 failed connection attempts
    1361 connection resets received
    18 connections established
    139649288 segments received
    136411978 segments send out
    10506 segments retransmited
    9 bad segments received.
    28284049 resets sent
Udp:
    2064989 packets received
    48 packets to unknown port received.
    0 packet receive errors
    2066536 packets sent
    0 receive buffer errors
    0 send buffer errors
    IgnoredMulti: 31235
UdpLite:
TcpExt:
    17824374 TCP sockets finished time wait in fast timer
    15638 delayed acks sent
    2170 delayed acks further delayed because of locked socket
    Quick ack mode was activated 392 times
    8177072 packet headers predicted
    39935467 acknowledgments not containing data payload received
    9413542 predicted acknowledgments
    612 times recovered from packet loss by selective acknowledgements
    Detected reordering 1033 times using SACK
    Detected reordering 21 times using time stamp
    2 congestion windows fully recovered without slow start
    15 congestion windows partially recovered using Hoe heuristic
    97 congestion windows recovered without slow start by DSACK
    50 congestion windows recovered without slow start after partial ack
    TCPLostRetransmit: 1469
    2 timeouts after SACK recovery
    7 timeouts in loss state
    1631 fast retransmits
    155 retransmits in slow start
    2084 other TCP timeouts
    TCPLossProbes: 8732
    TCPLossProbeRecovery: 49
    87 SACK retransmits failed
    TCPBacklogCoalesce: 87720
    393 DSACKs sent for old packets
    1 DSACKs sent for out of order packets
    5975 DSACKs received
    3 DSACKs for out of order packets received
    59 connections reset due to unexpected data
    1275 connections reset due to early user close
    49 connections aborted due to timeout
    TCPDSACKIgnoredNoUndo: 5085
    TCPSpuriousRTOs: 37
    TCPSackShifted: 348
    TCPSackMerged: 486
    TCPSackShiftFallback: 2931
    TCPRcvCoalesce: 756203
    TCPOFOQueue: 8973
    TCPOFOMerge: 1
    TCPChallengeACK: 22
    TCPSYNChallenge: 22
    TCPSpuriousRtxHostQueues: 37
    TCPAutoCorking: 184636
    TCPFromZeroWindowAdv: 881
    TCPToZeroWindowAdv: 881
    TCPWantZeroWindowAdv: 3108
    TCPSynRetrans: 1632
    TCPOrigDataSent: 50254798
    TCPHystartTrainDetect: 59
    TCPHystartTrainCwnd: 5519
    TCPACKSkippedSeq: 3
    TCPWinProbe: 1
    TCPKeepAlive: 256475
    TCPDelivered: 51360491
    TCPAckCompressed: 6199
IpExt:
    InNoRoutes: 26
    OutMcastPkts: 2
    InBcastPkts: 31235
    InOctets: 16917283081
    OutOctets: 13614894861
    OutMcastOctets: 80
    InBcastOctets: 2459890
    InNoECTPkts: 195484275




# ss -s
Total: 293 (kernel 2549)
TCP:   72 (estab 18, closed 42, orphaned 0, synrecv 0, timewait 38/0), ports 0

Transport Total     IP        IPv6
*         2549      -         -        
RAW       0         0         0        
UDP       2         1         1        
TCP       30        23        7        
INET      32        24        8        
FRAG      0         0         0 

ss命令输出的统计信息相比netstat少,ss只显示已经连接(estab)、关闭(closed)、孤儿(orphaned) socket等简要统计。
而netstat则有更详细的网络协议栈信息,比如上面显示了TCP 协议的主动连接(active connections openings)、被动连接(passive connection openings)、失败重试(failed connection attempts)、发送(segments send out)和接收(segments received)的分段数量等各种信息。

查看网络吞吐率和PPS

可以使用sar命令查看当前网络的吞吐率和 PPS,用法是给 sar 增加-n参数就可以查看网络的统计信息,比如

  • sar -n DEV,显示网口的统计数据;
  • sar -n EDEV,显示关于网络错误的统计数据;
  • sar -n TCP,显示 TCP 的统计数据;

比如,我通过命令获取了网口的统计信息:

# 数字1表示每隔1秒输出一组数据
# sar -n DEV 1
Linux 5.4.259-1.el7.elrepo.x86_64 (devops03)    09/11/24        _x86_64_        (4 CPU)

20:07:39        IFACE   rxpck/s   txpck/s    rxkB/s    txkB/s   rxcmp/s   txcmp/s  rxmcst/s
20:07:40      docker0      0.00      0.00      0.00      0.00      0.00      0.00      0.00
20:07:40           lo      0.00      0.00      0.00      0.00      0.00      0.00      0.00
20:07:40         eth0      6.00      2.00      1.79      0.61      0.00      0.00      0.00
20:07:40    veth80c838e      0.00      0.00      0.00      0.00      0.00      0.00      0.00
20:07:40    vethf2f2053      0.00      0.00      0.00      0.00      0.00      0.00      0.00

20:07:40        IFACE   rxpck/s   txpck/s    rxkB/s    txkB/s   rxcmp/s   txcmp/s  rxmcst/s
20:07:41      docker0      0.00      0.00      0.00      0.00      0.00      0.00      0.00
20:07:41           lo      0.00      0.00      0.00      0.00      0.00      0.00      0.00
20:07:41         eth0      5.00      2.00      0.30      0.82      0.00      0.00      0.00
20:07:41    veth80c838e      0.00      0.00      0.00      0.00      0.00      0.00      0.00
20:07:41    vethf2f2053      0.00      0.00      0.00      0.00      0.00      0.00      0.00

20:07:41        IFACE   rxpck/s   txpck/s    rxkB/s    txkB/s   rxcmp/s   txcmp/s  rxmcst/s
20:07:42      docker0      0.00      0.00      0.00      0.00      0.00      0.00      0.00
20:07:42           lo      0.00      0.00      0.00      0.00      0.00      0.00      0.00
20:07:42         eth0     11.94      8.96      1.65      2.15      0.00      0.00      0.00
20:07:42    veth80c838e      0.00      0.00      0.00      0.00      0.00      0.00      0.00
20:07:42    vethf2f2053      0.00      0.00      0.00      0.00      0.00      0.00      0.00

Average:        IFACE   rxpck/s   txpck/s    rxkB/s    txkB/s   rxcmp/s   txcmp/s  rxmcst/s
Average:      docker0      0.00      0.00      0.00      0.00      0.00      0.00      0.00
Average:           lo      0.00      0.00      0.00      0.00      0.00      0.00      0.00
Average:         eth0      7.12      3.75      1.19      1.08      0.00      0.00      0.00
Average:    veth80c838e      0.00      0.00      0.00      0.00      0.00      0.00      0.00
Average:    vethf2f2053      0.00      0.00      0.00      0.00      0.00      0.00      0.00

它们的含义:

  • rxpck/s 和 txpck/s 分别是接收和发送的 PPS,单位为包/秒。
  • rxkB/s 和 txkB/s 分别是接收和发送的吞吐率,单位是KB/秒。
  • rxcmp/s 和 txcmp/s分别是接收和发送的压缩数据包数,单位是包/秒。

对于带宽,我们可以使用ethtool命令来查询,它的单位通常是 Gb/s或者 Mb/s,不过注意这里小写字母b,表示比特而不是字节。我们通常提到的千兆网卡、万兆网卡等,单位也都是比特(bit)。如下你可以看到,eth0网卡就是一个千兆网卡:

# ethtool eth0|grep Speed
        Speed: 10000Mb/s

查看连通性和延时

要测试本机与远程主机的连通性和延时,通常是使用 ping 命令,它是基于 ICMP 协议的,工作在网络层。
比如,如果要测试本机到www.baidu.com的连通性和延时:

# -c 表示发送 3 次 ICMP 包
ping -c 3 -w 3 www.baidu.com
PING www.a.shifen.com (180.101.50.242) 56(84) bytes of data.
64 bytes from 180.101.50.242 (180.101.50.242): icmp_seq=1 ttl=50 time=6.26 ms
64 bytes from 180.101.50.242 (180.101.50.242): icmp_seq=2 ttl=50 time=6.24 ms
64 bytes from 180.101.50.242 (180.101.50.242): icmp_seq=3 ttl=50 time=6.23 ms

--- www.a.shifen.com ping statistics ---
3 packets transmitted, 3 received, 0% packet loss, time 2020ms
rtt min/avg/max/mdev = 6.234/6.247/6.262/0.091 ms

显示的内容主要包含icmp_seq(ICMP序列号)、TTL(生存时间,或者跳数)以及 time(往返延时),而且最后会汇总本次测试的情况,如果网络没有丢包,packet loss的百分比就是0。

不过,需要注意的是,ping不通服务器并不代表HTTP请求也不通,因为有的服务器的防火墙是会禁用ICMP协议的。

posted on 2024-09-11 20:24  jiayou111  阅读(76)  评论(0编辑  收藏  举报