扫二维码与项目经理沟通
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流
如果客户端连续不断的向服务端发送数据包时,服务端接收的数据会出现两个数据包粘在一起的情况,这就是TCP协议中经常会遇到的粘包以及拆包的问题。
成都创新互联公司专业提供德阳服务器托管服务,为用户提供五星数据中心、电信、双线接入解决方案,用户可自行在线购买德阳服务器托管服务,并享受7*24小时金牌售后服务。
传输层的UDP协议是否会发生粘包或者拆包问题?
不会。UDP是基于报文发送的,在UDP首部采用了16bit来指示UDP数据报文的长度,因此在应用层能很好的将不同的数据报文区分开,从而避免粘包和拆包的问题。
传输层的TCP协议是否会发生粘包或者拆包问题?
会。原因有以下两点:
1、TCP是基于字节流的,虽然应用层和传输层之间的数据交互是大小不等的数据块,但是TCP把这些数据块仅仅看成一连串无结构的字节流,没有边界;
2、在TCP的首部没有表示数据长度的字段,基于上面两点,在使用TCP传输数据时,才有粘包或者拆包现象发生的可能。
现在假设客户端向服务端连续发送了两个数据包,用packet1和packet2来表示,那么服务端收到的数据可以分为三种,现列举如下:
第一种情况,接收端正常收到两个数据包,即没有发生拆包和粘包的现象,此种情况不在本文的讨论范围内。
第二种情况,接收端只收到一个数据包,由于TCP是不会出现丢包的,所以这一个数据包中包含了发送端发送的两个数据包的信息,这种现象即为粘包。这种情况由于接收端不知道这两个数据包的界限,所以对于接收端来说很难处理。
第三种情况,这种情况有两种表现形式,如下图。接收端收到了两个数据包,但是这两个数据包要么是不完整的,要么就是多出来一块,这种情况即发生了拆包和粘包。这两种情况如果不加特殊处理,对于接收端同样是不好处理的。
发生TCP粘包或拆包有很多原因,现列出常见的几点:
1、要发送的数据大于TCP发送缓冲区剩余空间大小,将会发生拆包。
2、待发送数据大于MSS(最大报文长度),TCP在传输前将进行拆包。
3、要发送的数据小于TCP发送缓冲区的大小,TCP将多次写入缓冲区的数据一次发送出去,将会发生粘包。
4、接收数据端的应用层没有及时读取接收缓冲区中的数据,将发生粘包。
通过以上分析,我们清楚了粘包或拆包发生的原因,那么如何解决这个问题呢?解决问题的关键在于如何给每个数据包添加边界信息,常用的方法有如下几个:
1、发送端给每个数据包添加包首部,首部中应该至少包含数据包的长度,这样接收端在接收到数据后,通过读取包首部的长度字段,便知道每一个数据包的实际长度了。
2、发送端将每个数据包封装为固定长度(不够的可以通过补0填充),这样接收端每次从接收缓冲区中读取固定长度的数据就自然而然的把每个数据包拆分开来。
3、可以在数据包之间设置边界,如添加特殊符号,这样,接收端通过这个边界就可以将不同的数据包拆分开。
Tomcat是通过http的协议来进行传输数据的,http协议在请求头内有一个Content-Length字段来告诉服务端请求体的长度,并且请求头和请求体通过空一行来分开的
Netty支持多种处理粘包和拆包的方式,可以根据具体的场景进行选择。
参考:
TCP协议下的粘包与拆包,如何解决一、粘包、拆包1.1 粘包原因1.1.1 滑动窗口1.1.2 Nagle算法1.1.3 应用层原因1.2 拆包原因1.2.1 滑动窗口1.2.2 MSS限制1.2.3 应用层原因1.2 Netty提供的解决方案二、自定义协议解决粘包、拆包2.1 自定义协议要素
因为TCP/IP在起初,所有的请求是串行化的,之后做成了滑动窗口的概念。那么在接收方,如果接收不及时且窗口大小足够大,就可能出现粘包的情况。
因为每次数据发送的时候,都需要加上消息头等特殊数据,TCP与IP协议分别会加20Byte数据,因此哪怕只是发送1Byte数据,最终接收方还是会接收到41Byte;在这样的背景下,Nagle算法可能会将多个数据包合并在一起发送。
接收方ByteBuf设置太大(Netty默认为1024Byte),因此如果客户端发送的报文都非常小,抛开上述 1.1.1.1 中的原因不谈,光在Netty这一处也非常容易出现粘包现象
假设接收方的窗口只剩128Bytes,发送方的报文大小是256Bytes,这时放不下了,只能先发送前128Bytes,等待ack后,窗口有剩余空间了才会发送剩余部分,这就导致了拆包
当发送数据超过MSS限制后,会将数据切分发送,而这个MSS是根据不同类型网卡的限制来看,譬如某笔记本网卡可以发送1500Byte,除去一次数据包中的TCP/IP固定40Byte外,真正的数据也只能发送1460Byte。
Netty中ByteBuf设置的大小小于数据包大小。
未完待续... ...
粘包和分包是利用Socket在TCP协议下内部的优化机制。
1、什么是粘包
只有TCP有粘包现象,UDP永远不会粘包,为何,且听我娓娓道来。发送数据时间间隔很短,数据了很小,也就是发送数据比较频繁,会合到一起,产生粘包;
2、什么是分包
当我们发送的数据量很大的时候,可能是几千字节,TCP就会自动分开发送,其实说通俗点,就是你去拿快递,一看20个,一次拿不完,分几次拿!
3、总结
指发送方发送的若干包数据到接收方接收时粘成一包,从接收缓冲区看,后一包数据的头紧接着前一包数据的尾。出现粘包现象的原因是多方面的,它既可能由发送方造成,也可能由接收方造成。
发送方引起的粘包是由TCP协议本身造成的,TCP为提高传输效率,发送方往往要收集到足够多的数据后才发送一包数据。
若连续几次发送的数据都很少,通常TCP会根据优化算法把这些数据合成一包后一次发送出去,这样接收方就收到了粘包数据。接收方引起的粘包是由于接收方用户进程不及时接收数据,从而导致粘包现象。
这是因为接收方先把收到的数据放在系统接收缓冲区,用户进程从该缓冲区取数据,若下一包数据到达时前一包数据尚未被用户进程取走,则下一包数据放到系统接收缓冲区时就接到前一包数据之后,而用户进程根据预先设定的缓冲区大小从系统接收缓冲区取数据,这样就一次取到了多包数据。分包是指在出现粘包的时候我们的接收方要进行分包处理。
在前面的测试程序中,是没有粘包问题的,这时候你可能有疑惑,我为啥数据会发送的特别快,我们以游戏服务器举例,比如游戏有联机对战功能,这时候肯定是需要同步位置信息的,这个频率是很快的,大约每秒就要40~80次,这个时候就会出现粘包问题。
其实很简单只要简单修改一下客户端即可。
1、程序测试 — 粘包问题
客户端:
服务器查看调试信息:
服务器已启动......
有一个客户端进行连接成功......
从客户端接收到的数据:0
从客户端接收到的数据:123
从客户端接收到的数据:4567
从客户端接收到的数据:8910
从客户端接收到的数据:1112131415
从客户端接收到的数据:161718
从客户端接收到的数据:192021222324
从客户端接收到的数据:25262728
从客户端接收到的数据:2930313233
从客户端接收到的数据:34353637
从客户端接收到的数据:38394041
从客户端接收到的数据:42434445
从客户端接收到的数据:46474849
从客户端接收到的数据:50515253
从客户端接收到的数据:5455565758
从客户端接收到的数据:59606162636465666768
从客户端接收到的数据:6970717273
从客户端接收到的数据:74757677
从客户端接收到的数据:78798081
从客户端接收到的数据:82838485
从客户端接收到的数据:86878889
从客户端接收到的数据:90919293
从客户端接收到的数据:9495969798
从客户端接收到的数据:99
(很明显数据没有发送100次)
1、程序测试 — 粘包问题
客户端:
服务器查看调试信息:
服务器已启动......
有一个客户端进行连接成功......
从客户端接收到的数据:
0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000撒大声地所多所多所多所多所多所多所多所多所多所000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000撒大声地所多所多所多所多所多所多所多所多所多所多所多所多所多所多撒大声地所 多所多所多所多所多所多所多所多所多所多所多所多所多所多撒大声地所多所多所多所多所多所多所多所多所多所多所多所多所多所多000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000----------------------------------------------------------------撒大声地所多所多所多所多所多所多所多所多所?
从客户端接收到的数据:
77777777777777777777777777777777777777777777777777777777790909090909090909090909090909090909090000000000000000000000000099
(可以看出服务器是分两次接收的,但其实只要static byte[] dataBuffer = new byte[1024];给的空间足够大,分包问题就可解决)
其实也很好解决,我们在发送数据的时候事先存储数据的长度,不过用来存储数据长度的内存大小需要指定好,否则就没法判断了。
假设我们现在的数据出现了粘包,如下图所示:
这里只是演示一下,如果只有连续发送4次数据,一般是不会出现粘包的,看上图橙色部分表示我们用一个int32类型储存数据的长度,蓝色部分为我们实际要发送的数据,现在发生了粘包,也就是这四条数据合在一起发送给了服务器,
此时这条数据的总大小为 4字节 * 4 + 5 + 7 + 10 + 4 = 42字节
我们通过读取4字节数据可以知道数据的实际长度,以第一个数据为例,我们读取4字节数据,知道了这个数据有5个字节,程序如下:
int data_length = BitConverter.ToInt32(_data, 0);
此时的data_length = 5;此时我们就读取这5个字节的数据即可!
string s = Encoding.UTF8.GetString(_data, 4, 5);
然后我们截取数据,从源数据的第4 + 5的位置开始截取到一个新数组,新字节数组索引从零开始,此时新字节数据的长度为42 - (5 + 4);(下图为新字节数组)
Array.Copy(_data, 5 + 4, _data, 0, 42 - (5 + 4));
依次循环下去,粘包就被成功的分包了。当然这个不要忘记每次更新一下当前数据长度。
_curLength = _curLength - (data_length + 4); // _curLength = 42 - (5 + 4)
1、客户端
创建Message类,用于发送数据前做处理,使得首4字节储存数据长度。
Message:
Main:
2、服务端
创建Message类,解决粘包问题!
Main:
服务器查看调试信息:
服务器已启动......
有一个客户端进行连接成功......
解析到一条数据:0米
4
8
解析到一条数据:1米
4
630
解析到一条数据:2米
4
622
解析到一条数据:3米
4
614
解析到一条数据:4米
4
606
解析到一条数据:5米
4
598
解析到一条数据:6米
4
590
解析到一条数据:7米
4
582
解析到一条数据:8米
4
574
解析到一条数据:9米
4
566
解析到一条数据:10米
5
558
..............................................................................
解析到一条数据:98米
5
18
解析到一条数据:99米
5
9
有客户端退出.....
你解决个屁,异步接收的情况下,把_data数组调大点就完了,傻逼,咱们是做游戏!一般不会有分包问题!!
用户数据报协议(User Datagram Protocol,缩写为UDP),又称用户数据报文协议,是一个简单的面向数据报(package-oriented)的传输层协议,正式规范为RFC 768。
UDP只提供数据的不可靠传递,它一旦把应用程序发给网络层的数据发送出去,就不保留数据备份(所以UDP有时候也被认为是不可靠的数据报协议)。
UDP在IP数据报的头部仅仅加入了复用和数据校验。
由于缺乏可靠性且属于非连接导向协议,UDP应用一般必须允许一定量的丢包、出错和复制粘贴。
1 在接收udp包时,如果接收包时给定的buffer太小的话,就要自己解决粘包问题。
2 udp包的发送和接收不保证一定成功,不保证按正确顺序抵达。
3 如果不允许丢包的情况出现的话,要有重发机制来保证,如:反馈机制确认。
服务端
客户端
在开发程序的时候 使用易语言的 服务端 与 客户端 控件时 ,一般不直接使用发送数据功能。
因为网络存在丢包的可能,所以易语言的服务端会自动的重发刚刚丢失的包,直到完全结束。
有很多新手朋友在使用易语言传送文件的老出现这个问题。
估计你的这个问题也是一样的原因照成的,丢包!
最简单有效的解决办法:
封装一个发包的方法,我这里已服务端给客户端发送消息举例,到时候你还需要同样在客户端上写相同的代码。
-------------------------------------------
.版本 2
.程序集 窗口程序集1
.程序集变量 temp数据包尾部, 文本型
.子程序 __启动窗口_创建完毕
temp数据包尾部 = “{【结尾】[over]}”
.子程序 封装的发送方法
.参数 客户IP, 文本型
.参数 data, 字节集
服务器1.发送数据 (客户IP, data + 到字节集 (temp数据包尾部), )
.子程序 _服务器1_数据到达
接收到的数据进行处理 (服务器1.取回数据 ())
.子程序 接收到的数据进行处理
.参数 data, 字节集
.局部变量 oldData, 字节集, 静态, , 注意,这是一个静态的变量,如果理解不到静态的意思就请使用全局变量
oldData = oldData + oldData
' 判断如果 该数据包的尾部不等于
.如果 (取字节集右边 (oldData, 取字节集长度 (oldData) - 取文本长度 (temp数据包尾部)) ≠ 到字节集 (temp数据包尾部))
' 如果说不相同就说明 数据还没有完全的过来,所以这里不做任何处理
.否则
处理完整传递的数据 (oldData) ' 如果相等了,就说明数据已经完全的过来了,我们就调用数据传递后的方法
oldData = { } ' 这里记住,调用完毕后就必须置空字节集
.如果结束
.子程序 处理完整传递的数据
.参数 data, 字节集
' 在这里就可以写你的处理方法了,
' by : 炫e小锋 QQ:251708339
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流