Socket编程实践(5) --TCP粘包问题与解决
TCP粘包问题
由于TCP协议是基于字节流且无边界的传输协议, 因此很有可能产生粘包问题, 问题描述如下
对于Host A 发送的M1与M2两个各10K的数据块, Host B 接收数据的方式不确定, 有以下方式接收:
先接收M1, 再接收M2(正确方式)
先接收M2, 再接收M1(错误)
一次性收到20k数据(错误)
分两次收到,第一次15k,第二次5k(错误)
分两次收到,第一次5k,第二次15k(错误)
其他任何可能(错误)
粘包产生的原因
1、SQ_SNDBUF 套接字本身有缓冲区 (发送缓冲区、接受缓冲区)
2、tcp传送的端 mss大小限制
3、链路层也有MTU大小限制,如果数据包大于>MTU要在IP层进行分片,导致消息分割。
4、tcp的流量控制和拥塞控制,也可能导致粘包
5、tcp延迟发送机制等
TCP与UDP关于粘包问题的对比
TCP |
UDP |
字节流 |
数据报 |
无边界 |
有边界 |
对等方的一次读操作并不能保证完全把消息读完 |
对方接收数据包的个数是不确定的 |
粘包解决方案(本质上是要在应用层维护消息与消息的边界)
(1)定长包
该方式并不实用: 如果所定义的长度过长, 则会浪费网络带宽, 而又如果定义的长度过短, 则一条消息又会拆分成为多条, 仅在TCP的应用一层就增加了合并的开销, 何况在其他层(因此我在博客中并未给出定长包的示例, 而是将之(一个不太完善的实现)与使用自定义报头的示例放到了一起, 感兴趣的读者可以下载下来查看);
(2)包尾加\r\n(FTP使用方案)
如果消息本身含有\r\n字符,则也分不清消息的边界;
(3)报文长度+报文内容
(4)更复杂的应用层协议
readn / writen实现
Socket, 管道以及某些设备(特别是终端和网络)有下列两种性质:
1)一次read操作所返回的数据可能少于所要求的数据,即使还没到达文件尾端也可能这样,但这不是一个错误,应当继续读该设备;
2)一次write操作的返回值也可能少于指定输入的字节数.这可能是由于某个因素造成的,如:内核缓冲区满...但这也不是一个错误,应当继续写余下的数据(通常,只有非阻塞描述符,或捕捉到一个信号时,才发生这种write的中途返回)
在读写磁盘文件时从未见到过这种情况,除非是文件系统用完了空间,或者接近了配额限制,不能将所要求写的数据全部写出!
通常,在读/写一个网络设备,管道或终端时,需要考虑这些特性.于是,我们就有了下面的这两个函数:readn和writen,功能分别是读/写指定的count字节数据,并处理返回值可能小于要求值的情况:
/**实现: 这两个函数只是按需多次调用read和write系统调用直至读/写了count个数据 **/ /**返回值说明: == count: 说明正确返回, 已经真正读取了count个字节 == -1 : 读取出错返回 < count: 读取到了末尾 **/ ssize_t readn(int fd, void *buf, size_t count) { size_t nLeft = count; ssize_t nRead = 0; char *pBuf = (char *)buf; while (nLeft > 0) { if ((nRead = read(fd, pBuf, nLeft)) < 0) { //如果读取操作是被信号打断了, 则说明还可以继续读 if (errno == EINTR) continue; //否则就是其他错误 else return -1; } //读取到末尾 else if (nRead == 0) return count-nLeft; //正常读取 nLeft -= nRead; pBuf += nRead; } return count; }
/**返回值说明: == count: 说明正确返回, 已经真正写入了count个字节 == -1 : 写入出错返回 **/ ssize_t writen(int fd, const void *buf, size_t count) { size_t nLeft = count; ssize_t nWritten = 0; char *pBuf = (char *)buf; while (nLeft > 0) { if ((nWritten = write(fd, pBuf, nLeft)) < 0) { //如果写入操作是被信号打断了, 则说明还可以继续写入 if (errno == EINTR) continue; //否则就是其他错误 else return -1; } //如果 ==0则说明是什么也没写入, 可以继续写 else if (nWritten == 0) continue; //正常写入 nLeft -= nWritten; pBuf += nWritten; } return count; }
报文长度+报文内容实践
发报文时:前四个字节长度+报文内容一次性发送;
收报文时:先读前四个字节,求出报文内容长度;根据长度读数据。
发送结构:
struct Packet { unsigned int msgLen; //数据部分的长度(网络字节序) char text[1024]; //报文的数据部分 };
//server端echo部分的改进代码 void echo(int clientfd) { struct Packet buf; int readBytes; //首先读取首部 while ((readBytes = readn(clientfd, &buf.msgLen, sizeof(buf.msgLen))) > 0) { //网络字节序 -> 主机字节序 int lenHost = ntohl(buf.msgLen); //然后读取数据部分 readBytes = readn(clientfd, buf.text, lenHost); if (readBytes == -1) err_exit("readn socket error"); else if (readBytes != lenHost) { cerr << "client connect closed..." << endl; return ; } cout << buf.text; //然后将其回写回socket if (writen(clientfd, &buf, sizeof(buf.msgLen)+lenHost) == -1) err_exit("write socket error"); memset(&buf, 0, sizeof(buf)); } if (readBytes == -1) err_exit("read socket error"); else if (readBytes != sizeof(buf.msgLen)) cerr << "client connect closed..." << endl; }
//client端发送与接收代码 ... struct Packet buf; memset(&buf, 0, sizeof(buf)); while (fgets(buf.text, sizeof(buf.text), stdin) != NULL) { /**写入部分**/ unsigned int lenHost = strlen(buf.text); buf.msgLen = htonl(lenHost); if (writen(sockfd, &buf, sizeof(buf.msgLen)+lenHost) == -1) err_exit("writen socket error"); /**读取部分**/ memset(&buf, 0, sizeof(buf)); //首先读取首部 ssize_t readBytes = readn(sockfd, &buf.msgLen, sizeof(buf.msgLen)); if (readBytes == -1) err_exit("read socket error"); else if (readBytes != sizeof(buf.msgLen)) { cerr << "server connect closed... \nexiting..." << endl; break; } //然后读取数据部分 lenHost = ntohl(buf.msgLen); readBytes = readn(sockfd, buf.text, lenHost); if (readBytes == -1) err_exit("read socket error"); else if (readBytes != lenHost) { cerr << "server connect closed... \nexiting..." << endl; break; } //将数据部分打印输出 cout << buf.text; memset(&buf, 0, sizeof(buf)); } ...
完整实现代码:
http://download.csdn.net/detail/hanqing280441589/8460557
按行读取实践
recv/send函数
ssize_t recv(int sockfd, void *buf, size_t len, int flags); ssize_t send(int sockfd, const void *buf, size_t len, int flags);
与read相比,recv只能用于套接字文件描述符,而且多了一个flags
recv的flags参数常用取值:
MSG_OOB(带外数据: 通过紧急指针发送的数据[需设置TCP头部紧急指针位有效])
This flag requests receipt of out-of-band data that would not be received
in the normal data stream. Some protocols place expedited data at the head of
the normal data queue, and thus this flag cannot be used with such protocols.
MSG_PEEK(可以读数据,但不从缓存区中读走[仅仅是一瞥],利用此特点可以方便的实现按行读取数据;一个一个字符的读,多次调用系统调用read方法,效率不高)
This flag causes the receive operation to return data from the beginning of
the receive queue without removing that data from the queue. Thus, a subsequent
receive call will return the same data.
/**示例: 通过MSG_PEEK封装一个recv_peek函数(仅查看数据, 但不取走)**/ ssize_t recv_peek(int sockfd, void *buf, size_t len) { while (true) { int ret = recv(sockfd, buf, len, MSG_PEEK); //如果recv是由于被信号打断, 则需要继续(continue)查看 if (ret == -1 && errno == EINTR) continue; return ret; } } /**使用recv_peek实现按行读取readline(只能用于socket)**/ /** 返回值说明: == 0: 对端关闭 == -1: 读取出错 其他: 一行的字节数(包含'\n') **/ ssize_t readline(int sockfd, void *buf, size_t maxline) { int ret; int nRead = 0; int returnCount = 0; char *pBuf = (char *)buf; int nLeft = maxline; while (true) { ret = recv_peek(sockfd, pBuf, nLeft); //如果查看失败或者对端关闭, 则直接返回 if (ret <= 0) return ret; nRead = ret; for (int i = 0; i < nRead; ++i) //在当前查看的这段缓冲区中含有'\n', 则说明已经可以读取一行了 if (pBuf[i] == '\n') { //则将缓冲区内容读出 //注意是i+1: 将'\n'也读出 ret = readn(sockfd, pBuf, i+1); if (ret != i+1) exit(EXIT_FAILURE); return ret + returnCount; } // 如果在查看的这段消息中没有发现'\n', 则说明还不满足一条消息, // 在将这段消息从缓冲中读出之后, 还需要继续查看 ret = readn(sockfd, pBuf, nRead);; if (ret != nRead) exit(EXIT_FAILURE); pBuf += nRead; nLeft -= nRead; returnCount += nRead; } //如果程序能够走到这里, 则说明是出错了 return -1; }
readline实现思想:
在readline函数中,我们先用recv_peek”偷窥” 一下现在缓冲区有多少个字符并读取到pBuf,然后查看是否存在换行符'\n'。如果存在,则使用readn连同换行符一起读取(作用相当于清空socket缓冲区); 如果不存在,也清空一下缓冲区, 且移动pBuf的位置,回到while循环开头,再次窥看。注意,当我们调用readn读取数据时,那部分缓冲区是会被清空的,因为readn调用了read函数。还需注意一点是,如果第二次才读取到了'\n',则先用returnCount保存了第一次读取的字符个数,然后返回的ret需加上原先的数据大小。
按行读取echo代码:
void echo(int clientfd) { char buf[512] = {0}; int readBytes; while ((readBytes = readline(clientfd, buf, sizeof(buf))) > 0) { cout << buf; if (writen(clientfd, buf, readBytes) == -1) err_exit("writen error"); memset(buf, 0, sizeof(buf)); } if (readBytes == -1) err_exit("readline error"); else if (readBytes == 0) cerr << "client connect closed..." << endl; }
client端读取与发送代码
... char buf[512] = {0}; memset(buf, 0, sizeof(buf)); while (fgets(buf, sizeof(buf), stdin) != NULL) { if (writen(sockfd, buf, strlen(buf)) == -1) err_exit("writen error"); memset(buf, 0, sizeof(buf)); int readBytes = readline(sockfd, buf, sizeof(buf)); if (readBytes == -1) err_exit("readline error"); else if (readBytes == 0) { cerr << "server connect closed..." << endl; break; } cout << buf; memset(buf, 0, sizeof(buf)); } ...
完整代码实现:
http://download.csdn.net/detail/hanqing280441589/8460883
Socket编程实践(5) --TCP粘包问题与解决的更多相关文章
- 网络编程——TCP协议、UDP协议、socket套接字、粘包问题以及解决方法
网络编程--TCP协议.UDP协议.socket套接字.粘包问题以及解决方法 TCP协议(流式协议) 当应用程序想通过TCP协议实现远程通信时,彼此之间必须先建立双向通信通道,基于该双向通道实现数 ...
- Socket编程实践(6) --TCP服务端注意事项
僵尸进程处理 1)通过忽略SIGCHLD信号,避免僵尸进程 在server端代码中添加 signal(SIGCHLD, SIG_IGN); 2)通过wait/waitpid方法,解决僵尸进程 sign ...
- Java网络编程基础之TCP粘包拆包
TCP是个"流"协议,所谓流,就是没有界限的一串数据.大家可以想象河里的流水,他们是连成一片的,其间并没有分界线.TCP底层并不了解上层业务数据的具体含义,他会根据TCP缓冲区的实 ...
- 什么是TCP粘包?怎么解决这个问题
在socket网络编程中,都是端到端通信,由客户端端口+服务端端口+客户端IP+服务端IP+传输协议组成的五元组可以明确的标识一条连接.在TCP的socket编程中,发送端和接收端都有成对的socke ...
- 网络编程-SOCKET开发之----2. TCP粘包现象产生分析
1. 粘包现象及产生原因 1)概念 指TCP协议中,发送方发送的若干个包数据到接收方接收时粘成一包.发送方粘包:发送方把若干个要发送的数据包封装成一个包,一次性发送,减少网络IO延迟:接收方粘包:接收 ...
- 网络编程 TCP协议:三次握手,四次回收,反馈机制 socket套接字通信 粘包问题与解决方法
TCP协议:传输协议,基于端口工作 三次握手,四次挥手 TCP协议建立双向通道. 三次握手, 建连接: 1:客户端向服务端发送建立连接的请求 2:服务端返回收到请求的信息给客户端,并且发送往客户端建立 ...
- Socket编程实践(1) --TCP/IP简述
ISO的OSI OSI(open system interconnection)开放系统互联模型是由ISO国际标准化组织定义的网络分层模型,共七层, 从下往上为: OSI七层参考模型 物理层(Phys ...
- 02网络编程( socket套接字+TCP粘包 )
目录 02 网络编程 一.socket套接字编程 二.简易代码模板 2.1 服务端 2.2 客户端 三.通信循环及代码优化 四.黏包现象 五.struct模块 六.简易版本报头 七.上传文件数据 * ...
- TCP粘包/拆包问题
无论是服务端还是客户端,当我们读取或者发送消息的时候,都需要考虑TCP底层的粘包/拆包机制. TCP粘包/拆包 TCP是个"流"协议,所谓流,就是没有界限的一串数据.大家可以想想河 ...
随机推荐
- 焦点轮播图(tab轮播)
主要有两部分:1.列表导航(小图片) 2.展示区(大图片) 页面布局: HTML部分: <div class="s_conC"> ...
- ACM Where is the Marble?
Description Raju and Meena love to play with Marbles. They have got a lot of marbles with numbers ...
- Node.js 工具模块
在 Node.js 模块库中有很多好用的模块.接下来我们为大家介绍几种常用模块的使用: 序号 模块名 & 描述 1 OS 模块 提供基本的系统操作函数. 2 Path 模块提供了处理和转换文件 ...
- Rails里rake db:migrate出现undefined method last_comment问题的解决
这个问题和特定的rake版本有关,因为Rails要使用rake的last_comment方法在较新版本的rake中已被废弃,所以很多人卸载了新版本的rake去安装旧版本的rake. 这样也能解决问题, ...
- 无法启动postgresql的错误
chown postgres /etc/ssl/private/ssl-cert-snakeoil.key chgrp postgres /etc/ssl/private/ssl-cert-snake ...
- Hive基本原理及环境搭建
今天我主要是在折腾这个Hive,早上看了一下书,最开始有点凌乱,后面慢慢地发现,hive其实挺简单的,以我的理解就是和数据库有关的东西,那这样的话对我来说就容易多啦,因为我对sql语法应该是比较熟悉了 ...
- Android通知Notification全面剖析
通知 通知是您可以在应用的常规 UI 外部向用户显示的消息.当您告知系统发出通知时,它将先以图标的形式显示在通知区域中.用户可以打开抽屉式通知栏查看通知的详细信息. 通知区域和抽屉式通知栏均是由系统控 ...
- springMVC源码分析--SimpleControllerHandlerAdapter(三)
上一篇博客springMVC源码分析--HandlerAdapter(一)中我们主要介绍了一下HandlerAdapter接口相关的内容,实现类及其在DispatcherServlet中执行的顺序,接 ...
- Android捕获全局异常
Android捕获全局异常 程序避免不了出现bug,导致程序崩溃,为了尽量不影响用户体验,可以全局捕获异常 效果图 异常捕获处理前 异常捕获处理后(将程序重新启动) 捕获异常的工具类 package ...
- 2014 BDTC 参会有感
中国大数据技术大会(Big Data Technology Conference,BDTC)是目前国内最具影响.规模最大的大数据领域的技术盛会.大会的前身是Hadoop中国云计算大会(Hadoop i ...