1. TCP粘包拆包底层原因
TCP协议是面向字节流的协议,TCP不像UDP一样,每一个数据报之间都有清晰的界限,tcp每一个字节流传到缓冲区后可能会由nagle算法将多个包整合成一个包进行处理,也就可能发生粘包拆包问题
2. TCP粘包拆包场景
如果客户端向服务端发送data1和data2,服务端的缓冲区可能存在以下三种情况:
第一种情况,服务端一共读到两个数据包,每个数据包都是完整的
第二种情况,服务端仅收到一个数据包,这个数据包含data1和data2
第三种情况:服务端收到了两个数据包,第一个数据包包含data1的一部分,第二个数据包包含data2的另一个部分和data2
3. TCP粘包拆包原因
应用程序写入的数据大于套接字缓冲区大小,这将会发生拆包。
应用程序写入数据小于套接字缓冲区大小,网卡将应用多次写入的数据发送到网络上,这将会发生粘包。
进行 MSS (最大报文长度)大小的 TCP 分段,当 TCP 报文长度-TCP 头部长度>MSS 的时候将发生拆包。
接收方法不及时读取套接字缓冲区数据,这将发生粘包。
4. 解决方案
使用带消息头的协议、消息头存储消息开始标识及消息长度信息,服务端获取消息头的时候解析出消息长度,然后向后读取该长度的内容。
设置定长消息,服务端每次读取既定长度的内容作为一条完整消息,当消息不够长时,空位补上固定字符。
设置消息边界,服务端从网络流中按消息编辑分离出消息内容,一般使用‘\n ’。
5. 具体实现
上述的三种解决方案都可以通过Netty编解码器实现,为了解决TCP粘包/拆包导致的半包读写问题,Netty默认提供了多种编解码器用于处理半包
LineBasedFrameDecoder
回车换行解码器,会依次遍历ByteBuf中的可读字节,判断是否有\n,如果有,就以此位置为结束
DelimiterBasedFrameDecoder
分隔符解码器,用户可以指定消息结束的分隔符
FixedLengthFrameDecoder
固定长度解码器,能够按照指定的长度对消息进行自动解码
LengthFieldBasedFrameDecoder
针对SMPP、HTTP等上层协议的解码器,自动屏蔽TCP底层的粘包拆包问题,按照协议头中携带的长度字段解析后面的消息体