套接字的默认状态是阻塞的。这就意味着当发出一个不能立即完成的套接字调用时,其进程将被投入睡眠,等待相应的操作完成。可能阻塞的套接字调用可分为以下4类:

  (1)输入操作,包括read,readv,recv,recvfrom和recvmsg共5个函数。如果某个进程对一个阻塞的TCP套接字(默认设置)调用这些输入函数之一,而且该套接字的接收缓冲区中没有数据可读,该进程将被投入睡眠,直到有一些数据到达。既然TCP是字节流协议,该进程的唤醒就是只要有一些数据到达,这些数据既可能是单个字节,也可能是一个完整的TCP分节中的数据,所以可以指定MSG_WAITALL标志。

  既然UDP是数据报协议,如果一个阻塞的UDP套接字的接收缓冲区为空,对它调用输入函数的进程将被投入睡眠,直到有UDP数据报到达。

  对于非阻塞的套接字,如果输入操作不能被满足(对于TCP套接字即至少有一个字节的数据报可读,对于UDP套接字即有一个完整的数据报可读),相应调用将立即返回一个EWOULDBLOCK错误。

  (2)输出操作,包括write,writev,send,sento和sendmsg共5个函数。对于一个TCP套接字,内核将从应用进程的缓冲区到该套接字的发送缓冲区复制数据。对于阻塞的套接字,如果其发送缓冲区中没有空间,进程将被投入睡眠,直到有空间为止。

  对于一个非阻塞的TCP套接字,如果其发送缓冲区中根本没有空间,输出函数调用将立即返回一个EWOULDBLOCK错误。如果其发送缓冲区中有一些空间,返回值将是内核能够复制到该缓冲区中的字节数。

  UDP套接字不存在真正的发送缓冲区。内核只是复制应用进程数据并把它沿协议栈向下传送,渐次冠以UDP首部和IP首部。因此对一个阻塞的UDP套接字(默认设置),输出函数调用将不会因与TCP套接字一样的原因而阻塞,不过有可能会因为其他的原因而阻塞。

  (3)接受外来连接,即accept函数。如果对一个阻塞的套接字调用accept函数,并且尚无新的连接到达,调用进程将被投入睡眠。如果对一个非阻塞的套接字调用accept函数,并且尚无新的连接到达,accept调用将立即返回一个EWOULDBLOCK错误。

  (4)发起外出连接,即用于TCP的connect函数(connect也可用于UDP,不过它不能是一个“真正”的连接建立起来,他只是使内核保存对端的IP地址和端口号)。TCP连接的建立涉及一个三次握手过程,而且connect函数一直等到客户收到自己的SYN的ACK为止才返回。这意味着TCP的每个connect总是阻塞其调用进程至少一个到服务器的RTT时间。

  如果对一个非阻塞的TCP套接字调用connect,并且连接不能立即建立,那么连接的建立能照样发起(譬如送出TCP三次握手的第一个分组),不过会返回一个EINPROGRESS错误。注意这个错误不同于上述三个情形中的返回的错误。

非阻塞读和写(str_cli函数)

  如果client调用write把内容发送给服务器,此时发送缓冲区已满,write则会阻塞,在此阻塞期间,可能有来自套接字缓冲区的数据可读;类似,如果从套接字缓冲区有一行文本输入可读,那么一旦标准输入比网络还要慢,那么进程可能阻塞于后续的write调用。

  以下程序维护两个缓冲区:to容纳从标准输入到服务器去的数据,fr容纳自服务器到标准输出的数据。

void str_cli(FILE *fp, int sockfd)
{
int maxfdp1, val, stdineof;
ssize_t n, nwritten;
fd_set rset, wset;
char to[MAXLINE], fr[MAXLINE];
char *toiptr, *tooptr, *friptr, *froptr; val = Fcntl(sockfd, F_GETFL, );
Fcntl(sockfd, F_SETFL, val | O_NONBLOCK); val = Fcntl(STDIN_FILENO, F_GETFL, );
Fcntl(STDIN_FILENO, F_SETFL, val | O_NONBLOCK); val = Fcntl(STDOUT_FILENO, F_GETFL, );
Fcntl(STDOUT_FILENO, F_SETFL, val | O_NONBLOCK); toiptr = tooptr = to; /* initialize buffer pointers */
friptr = froptr = fr;
stdineof = ; maxfdp1 = max(max(STDIN_FILENO, STDOUT_FILENO), sockfd) + ;
for ( ; ; )
{
FD_ZERO(&rset);
FD_ZERO(&wset);
if (stdineof == && toiptr < &to[MAXLINE])
FD_SET(STDIN_FILENO, &rset); /* read from stdin */
if (friptr < &fr[MAXLINE])
FD_SET(sockfd, &rset); /* read from socket */
if (tooptr != toiptr)
FD_SET(sockfd, &wset); /* data to write to socket */
if (froptr != friptr)
FD_SET(STDOUT_FILENO, &wset); /* data to write to stdout */ Select(maxfdp1, &rset, &wset, NULL, NULL); if (FD_ISSET(STDIN_FILENO, &rset))
{
if ( (n = read(STDIN_FILENO, toiptr, &to[MAXLINE] - toiptr)) < )
{
if (errno != EWOULDBLOCK)
err_sys("read error on stdin");
}
else if (n == )
{
fprintf(stderr, "%s: EOF on stdin\n", gf_time());
stdineof = ; /* all done with stdin */
if (tooptr == toiptr)//如果缓冲区不再有数据发送,就调用shutdown发送FIN到服务器;如果仍有数据发送,就推迟到缓冲区中数据写到套接字之后
Shutdown(sockfd, SHUT_WR);/* send FIN */
}
else
{
fprintf(stderr, "%s: read %d bytes from stdin\n", gf_time(), n);
toiptr += n; /* # just read */
FD_SET(sockfd, &wset); /* try and write to socket below */
}
}
if (FD_ISSET(sockfd, &rset))
{
if ( (n = read(sockfd, friptr, &fr[MAXLINE] - friptr)) < )
{
if (errno != EWOULDBLOCK)
err_sys("read error on socket");
}
else if (n == )
{
fprintf(stderr, "%s: EOF on socket\n", gf_time());
if (stdineof)
return; /*如果在标准输入上遇到EOF,则为正常的normal termination */
else
err_quit("str_cli: server terminated prematurely");//否则来自服务器的EOF并为预期
}
else
{
fprintf(stderr, "%s: read %d bytes from socket\n",gf_time(), n);
friptr += n; /* # just read */
FD_SET(STDOUT_FILENO, &wset); /* try and write below */
}
}
if (FD_ISSET(STDOUT_FILENO, &wset) && ( (n = friptr - froptr) > ))
{
if ( (nwritten = write(STDOUT_FILENO, froptr, n)) < )
{
if (errno != EWOULDBLOCK)
err_sys("write error to stdout");
}
else
{
fprintf(stderr, "%s: wrote %d bytes to stdout\n",gf_time(), nwritten);
froptr += nwritten; /* # just written */
if (froptr == friptr)
froptr = friptr = fr; /* back to beginning of buffer */
}
}
if (FD_ISSET(sockfd, &wset) && ( (n = toiptr - tooptr) > ))
{
if ( (nwritten = write(sockfd, tooptr, n)) < )
{
if (errno != EWOULDBLOCK)
err_sys("write error to socket");
}
else
{
fprintf(stderr, "%s: wrote %d bytes to socket\n",gf_time(), nwritten);
tooptr += nwritten; /* # just written */
if (tooptr == toiptr)
{
toiptr = tooptr = to; /* back to beginning of buffer */
if (stdineof)
Shutdown(sockfd, SHUT_WR); /* send FIN */
}
}
}
}
}

  str_cli的简单版本

  每当需要使用非阻塞式I/O时,更简单的办法是把应用程序任务划分为多个进程(fork)或多个线程。

  这个函数一开始就调用fork把当前进程划分成一个父进程和一个子进程。子进程把来自服务器的文本行复制到标准输出,父进程把来自标准输入的文本行复制到服务器。

void str_cli(FILE *fp, int sockfd)
{
    pid_t    pid;
    char    sendline[MAXLINE], recvline[MAXLINE];     if ( (pid = Fork()) == ) {        /* child: server -> stdout */
        while (Readline(sockfd, recvline, MAXLINE) > )
            Fputs(recvline, stdout);         kill(getppid(), SIGTERM);    /* in case parent still running */
        exit();
    }         /* parent: stdin -> server */
    while (Fgets(sendline, MAXLINE, fp) != NULL)
        Writen(sockfd, sendline, strlen(sendline));     Shutdown(sockfd, SHUT_WR);    /* EOF on stdin, send FIN */
    pause();
    return;
}

我们知道TCP连接是全双工的,而且父子进程共享同一个套接字:父进程往该套接字中写,子进程从该套接字中读。尽管套接字只有一个,其接收缓冲区和发送缓冲区也分别只有一个,然而这个套接字却有两个描述符在引用它:一个在父进程中,另一个在子进程中。

我们同样需要考虑进程终止序列。正常的终止序列从标准输入上遇到EOF之时开始发生。父进程读入来自标准输入的EOF后调用shutdown发送FIN。但当这发生之后,子进程需继续从服务器到标准输出执行数据复制,直到在套接字上读到EOF。

服务器进程过早终止也有可能发生。要是发生这种情况,子进程将在套接字上读到EOF。这样的子进程必须告知父进程停止从标准输入到套接字复制数据。子进程向父进程发送一个SIGTERM信号,以防止父进程仍在运行。如此处理的另一个手段是子进程无为的终止,使得父进程(如果仍在运行的话)捕获一个SIGCHLD信号。

父进程完成数据复制后调用pause让自己进入睡眠状态,直到捕获一个信号(子进程来的SIGTERM信号),尽管它不主动捕获任何信号。SIGTERM信号的默认行为是终止进程。

非阻塞connect

  当在一个非阻塞的TCP套接字上调用connect时,connect将立即返回一个EINPROGRESS错误,不过已经发起的TCP三路握手继续进行。非阻塞的connect有三个用途

  1.我们可以把三路握手叠加在其他处理上。完成一个connect要花一个RTT时间,其波动范围很大,从局域网上的几个毫秒到几百个毫秒甚至是广域网的几秒。这段时间可以处理其他工作。

  2.可以使用这个技术同时建立多个连接。

  3.使用select等待连接的建立,我们可以给select指定一个时间限制,使得我们能够缩短connect的超时。许多实现有着从75毫秒到数分钟的connect超时时间。应用程序有时想要一个更短的超时时间,可以使用非阻塞的connect.

  怎么使用connect:

  1. 先将套接字描述符设置为非阻塞,然后按照常规网络编程,直到调用connect时,connect将立即返回一个EINPROGRESS错误(ps: 已经发起的三路握手继续执行)。我们接着使用I/O复用(比如 select)检测这个连接或成功或失败的已建立条件,需要注意的处理细节。
  2. 尽管套接字是非阻塞的,如果连接的服务器在同一主机上,我们调用connect时,连接通常立刻建立。
  3. 关于select和非阻塞connect的以下两个规则:当连接成功建立时,描述符变为可写;当连接建立遇到错误时,描述符变为既可读又可写(TCP套接字可写的条件是发送缓冲区中有可用空间)。
int connect_nonb(int sockfd, const SA *saptr, socklen_t salen, int nsec)
{
int flags, n, error;
socklen_t len;
fd_set rset, wset;
struct timeval tval; flags = Fcntl(sockfd, F_GETFL, );
Fcntl(sockfd, F_SETFL, flags | O_NONBLOCK); error = ;
if ( (n = connect(sockfd, saptr, salen)) < )
if (errno != EINPROGRESS)//此错误为期望的错误,表示连接建立已经启动但尚未成功
return(-); /* Do whatever we want while the connect is taking place. */ if (n == )
goto done; /* connect completed immediately */ FD_ZERO(&rset);
FD_SET(sockfd, &rset);
wset = rset;
tval.tv_sec = nsec;
tval.tv_usec = ; if ( (n = Select(sockfd+, &rset, &wset, NULL,
nsec ? &tval : NULL)) == ) {
close(sockfd); /* timeout */
errno = ETIMEDOUT;
return(-);
} if (FD_ISSET(sockfd, &rset) || FD_ISSET(sockfd, &wset)) {
len = sizeof(error);
if (getsockopt(sockfd, SOL_SOCKET, SO_ERROR, &error, &len) < )
return(-); /* Solaris pending error */
} else
err_quit("select error: sockfd not set"); done:
Fcntl(sockfd, F_SETFL, flags); /* restore file status flags */ if (error) {
close(sockfd); /* just in case */
errno = error;
return(-);
}
return();
}

  如何判断非阻塞connect调用后,连接是否成功建立:

  1. 调用getpeername代替getsockopt,先判断套接字可读或可写条件,如果getpeername以ENOTCONN错误失败返回,那么连接已经建立失败,接着必须以SO_ERROR调用getsockopt,检查套接字上是否存在待处理错误。
  2. 以值为0的长度参数调用read,如果read失败,则connect失败,read返回错误errno给出原因,如果建立连接成功,read返回0.
  3. 再调用connect一次,他应该失败,如果错误是EISCONN,那么套接字已经成功连接,也就是第一次成功连接。

被中断的connect

  如果对于正常阻塞的套接字,其上的connect在调用TCP三路握手完成前被中断(比如捕捉了某个信号),则connect中断不能由内核自动重启,将返回EINTR,我们不能再次调用connect,这样做导致EADDRINUSE错误。

  这种情况下我们只能再次调用select,相对于非阻塞connect那样,连接建立完成时,select返回可读条件,建立连接失败时select返回套接字即可读又可写。

非阻塞accept

客户端

    /*
初始化套接字操作
*/ connect(sockfd,(sockaddr*)&servAddr,sizeof(servAddr)); struct linger ling;
ling.l_onoff=;//cause RST to sent on close()
ling.l_linger=;
setsockopt(sockfd,SOL_SOCKET,SO_LINGER,&ling,sizeof(ling));
close(sockfd);

服务器端

  1. if(FD_ISSET(listenfd,&rest))//new connection { sleep(); clien=sizeof(cliAddr); connfd=accept(listenfd,(sockaddr*)&cliAddr,&clien); }
  1. select向服务器返回可读,但是过一段时间在调用accept
  2. 在服务器从select返回到调用accept期间,服务器TCP收到来自客户端的RST
  3. 这个已完成得连接被服务器TCP驱除队列,假设队列中没有其他的已完成的连接
  4. 服务器端调用accept,但是没有已完成的连接,服务器会一直阻塞在accept上,直到其他某个客户建立连接

解决办法:

  1. 当使用select获悉某个监听套接字上何时有已完成连接准备被accept时,总是把这个监听套接字设置为非阻塞
  2. 在后续的accept调用中忽略以下错误:EWOULDBLOCK(源自bk,客户终止连接时),ECONNABORTED(POSIX实现,客户终止连接时,EPROTO(SVR4实现,客户中止连接时)和EINTR(如果有信号被捕获)

非阻塞式I/O的更多相关文章

  1. 并发式IO的解决方案:多路非阻塞式IO、多路复用、异步IO

    在Linux应用编程中的并发式IO的三种解决方案是: (1) 多路非阻塞式IO (2) 多路复用 (3) 异步IO 以下代码将以操作鼠标和键盘为实例来演示. 1. 多路非阻塞式IO 多路非阻塞式IO访 ...

  2. Swing做的非阻塞式仿飞秋聊天程序

    采用Swing 布局 NIO非阻塞式仿飞秋聊天程序, 切换皮肤颜色什么的小功能以后慢慢做 启动主程序. 当用户打开主程序后自动获取局域网段IP可以在 设置 --> IP网段过滤, 拥有 JMF ...

  3. 阻塞式和非阻塞式IO

    有很多人把阻塞认为是同步,把非阻塞认为是异步:个人认为这样是不准确的,当然从思想上可以这样类比,但方式是完全不同的,下面说说在JAVA里面阻塞IO和非阻塞IO的区别 在JDK1.4中引入了一个NIO的 ...

  4. Java IO(3)非阻塞式输入输出(NIO)

    在上篇<Java IO(2)阻塞式输入输出(BIO)>的末尾谈到了什么是阻塞式输入输出,通过Socket编程对其有了大致了解.现在再重新回顾梳理一下,对于只有一个“客户端”和一个“服务器端 ...

  5. Socket-IO 系列(三)基于 NIO 的同步非阻塞式编程

    Socket-IO 系列(三)基于 NIO 的同步非阻塞式编程 缓冲区(Buffer) 用于存储数据 通道(Channel) 用于传输数据 多路复用器(Selector) 用于轮询 Channel 状 ...

  6. Java基础知识强化之多线程笔记07:同步、异步、阻塞式、非阻塞式 的联系与区别

    1. 同步: 所谓同步,就是在发出一个功能调用时,在没有得到结果之前,该调用就不返回.但是一旦调用返回,就必须先得到返回值了. 换句话话说,调用者主动等待这个"调用"的结果. 对于 ...

  7. Java基础——NIO(二)非阻塞式网络通信与NIO2新增类库

    一.NIO非阻塞式网络通信 1.阻塞与非阻塞的概念  传统的 IO 流都是阻塞式的.也就是说,当一个线程调用 read() 或 write() 时,该线程被阻塞,直到有一些数据被读取或写入,该线程在 ...

  8. 为什么IO多路复用需要采用非阻塞式IO

    近段时间开始学习<Unix网络编程>,代码实现了一个简单的IO多路复用+阻塞式的服务端,在学习了非阻塞式IO后,有一个疑问,即: 假如调用了select,并且关注了几个描述字,当关注的描述 ...

  9. 4.NIO的非阻塞式网络通信

    /*阻塞 和 非阻塞 是对于 网络通信而言的*/ /*原先IO通信在进行一些读写操作 或者 等待 客户机连接 这种,是阻塞的,必须要等到有数据被处理,当前线程才被释放*/ /*NIO 通信 是将这个阻 ...

随机推荐

  1. Pymysql的常见使用方法

    cursor.fetchone()与cursor.fetchall()的区别: cursor.fetchone():只能显示一个数据 cursor.fetchall():才能显示查出来的所有数据  P ...

  2. go语言设计模式之Flyweight(享元模式)

    flyweight.go package flyweight import ( "time" ) const ( TEAM_A = "A" TEAB_B = & ...

  3. Redux API

    Redux API ​ Redux的API非常少.Redux定义了一系列的约定(contract),同时提供少量辅助函数来把这些约定整合到一起. ​ Redux只关心如何管理state.在实际的项目中 ...

  4. LG4516/LOJ2546 「JSOI2018」潜入行动 树上背包

    问题描述 LG4516 LOJ2546 题解 好一个毒瘤题. hkk:JSOI的签到题 设\(opt[i][j][0/1][0/1]\)代表结点\(i\)的子树,放置\(j\)个,\(i\)放不放,\ ...

  5. BZOJ1369/LG4395 「BOI2003」Gem 树形DP

    问题描述 LG4395 BZOJ1369 题解 发现对于结点 \(x\) ,其父亲,自己,和所有的孩子权值不同,共 \(3\) 类,从贪心的角度考虑,肯定是填 \(1,2,3\) 这三种. 于是套路树 ...

  6. 07-Django模板(1)

    模板介绍 作为web框架,Django提供了模板,用于编写html代码(嵌入模板代码,更快更方便的完成页面开发,在通过视图中渲染模板,将最终生成的页面返回给浏览器(客户端)).模板是关于外表的渲染的, ...

  7. C++入门到理解阶段二基础篇(1)——简介与环境安装

    1.C++ 简介 C++ 是一种静态类型的.编译式的.通用的.大小写敏感的.不规则的编程语言,支持过程化编程.面向对象编程和泛型编程. C++ 被认为是一种中级语言,它综合了高级语言和低级语言的特点. ...

  8. 为了“小命”,这款APP一定要下!火爆了!

    前言中国地震台网在 6 月 17 日测定:6 月 17 日 22 时 55 分,四川省宜宾市长宁县发生 6 级地震,震源深度 16 千米.成都高新减灾研究所通过电台广播.手机短信.电视等途径,提前 6 ...

  9. flex布局和边框阴影

    "妄"眼欲穿-CSS之flex布局和边框阴影 妄:狂妄: 不会的东西只有怀着一颗狂妄的心,假装能把它看穿吧. flex布局 main axis:主轴:cross axis:交叉轴 ...

  10. 【linux】dmesg命令显示开机信息和设备加载情况

    Linux命令dmesg用来显示开机信息,kernel会将开机信息存储在ring buffer中.您若是开机时来不及查看信息,可利用dmesg来查看.开机信息亦保存在/var/log目录中,名称为dm ...