下面是关于回送客户和服务器程序开发一些简单的心搏函数。这些函数可以发现对端主机或到对端的通信路径的过早失效。
         在给出这些函数之前我们必须提出一些警告。首先,有人会想到使用TCP的保持存活特性(SO_KEEPALIVE套接字选项)来提供这种功能,然而TCP得在连接已经闲置2小时之后才发送一个保持存活探测段。意识到这一点以后,他们的下一个问题是如何把保持存活参数改为一个小得多的值(往往是在秒钟的量级),以便更快的检测到失效。尽管缩短TCP的保持存活定时器参数在许多系统上确实可行,但是这些参数通常是按照内核而不是按照每个套接字维护的,因此改动他们将影响所有开启该选项的套接字。另外保持存活选项的用意绝不是这个目的(搞频率的轮询)。
        其次,两个端系统之间短暂的连接性丢失并非总是坏事。TCP一开始就设计成能够对付临时断连,而源自Berkeley的TCP实现将重传8-10分钟才放弃某个连接。较新的IP路由协议能够发现链接的失效,并且有可能在短时间内(譬如在秒钟量级上)启用候选的路径。因此应用程序开发人员必须审查想要引入心搏机制的具体应用,确实在没有听到对端应答的持续时间超过5-10S之后终止相应连接是件好事还是坏事。有些应用系统需要这种功能,不过大多数却并不需要。
       我们将使用TCP的紧急模式周期地轮询对端;在下面的讲解中我们假设每1S轮询一次,若持续5S没有听到对端应答则认为对端已不再存活,不过这些值可以由应用程序改动。

在这个例子中,客户每隔1S向服务器发送一个带外字节,服务器取该字节将导致它向客户发送回一个带外字节。每端都需要知道对端是否不复存在或者不再可达。客户和服务器每1S递增他们的cnt变量一次,每收到一个带外字节又把该变量重置为0。如果该计数器达到5(也就是说本进程已有5S没有收到来自对端的带外字节),那就认定连接失效。当有带外字节到达时,客户和服务器都是用SIGURG信号得以通知。我们在该图中间指出:数据,回送数据和带外字节都通过单个TCP连接交换。

如下是我们的heatbeat_cli函数设置客户的心搏特性,其中第二个参数是以秒为单位的轮询频率,第三个参数是放弃当前连接之前应该经历的持续无响应轮询次数。

  1. #include "unp.h"
  2. /* 给heartbeat_cli的参数的拷贝: 套接口描述字(信号处理程序需用它来发送和接收带外数据),SIGALRM的频率,在客户认为服务器或连接死掉之前没有来子服务器的响应的SIGALRM的总数,总量nprobes记录从最近一次服务器应答以来的SIGALRM的数目 */
  3. static int servfd;
  4. static int nsec; /* #seconds between each alarm */
  5. static int maxnprobes; /* #probes w/no response before quit */
  6. static int nprobes; /* #probes since last server response */
  7. static void sig_urg(int), sig_alrm(int);
  8. void heartbeat_cli(int servfd_arg, int nsec_arg, int maxnprobes_arg)
  9. {/* heartbeat_cli函数检查并且保存参数,给SIGURG和SIGALRM建立信号处理函数,将套接口的属主设为进程ID,alarm调度一个SIGALRM */
  10. servfd = servfd_arg; /* set globals for signal handlers */
  11. if( (nsec = nsec_arg) < )
  12. nsec = ;
  13. if( (maxnprobes = maxnprobes_arg) < nsec)
  14. maxnprobes = nsec;
  15. nprobes = ;
  16. Signal(SIGURG, sig_urg);
  17. Fcntl(servfd, F_SETOWN, getpid() );
  18. Signal(SIGALRM, sig_alrm);
  19. alarm(nesc);
  20. }
  21. static void sig_urg(int signo)
  22. {/* 当一个带外通知到来时,就会产生这个信号。我们试图去读带外字节,但如果还没有到(EWOULDBLOCK)也没有关系。由于系统不是在线接收带外数据,因此不会干扰客户读取它的普通数据。既然服务器仍然存活,nprobes就重置为0 */
  23. int n;
  24. char c;
  25. if( ( n = recv(servfd, &c, , MSG_OOB) ) < )
  26. {
  27. if(errno != EWOULDBLOCK)
  28. err_sys("recv error");
  29. }
  30. nprobes = ; /* reset counter */
  31. return; /* may interrupt client code */
  32. }
  33. static void sig_alrm(int signo)
  34. {/* 这个信号以有规律间隔产生。计数器nprobes增1, 如果达到了maxnprobes,我们认为服务器或者崩溃或者不可达。在这个例子中,我们结束客户进程,尽管其他的设计也可以使用:可以发送给主循环一个信号,或者作为另外一个参数给heartbeat_cli提供一个客户函数,当服务器看来死掉时调用它 */
  35. if( ++nprobes > maxnprobes)
  36. {
  37. fprintf(stderr, "server is unreachable \n");
  38. exit();
  39. }
  40. Send(servfd, "", , MSG_OOB);
  41. alarm(nsec);
  42. return; /* may interrupt client code */
  43. }

全局变量 3-6     前3个变量是heartbeat_cli函数参数的副本:套接字描述符(信号处理函数用它来发送和接收带外数据),SIGALRM的频率,在客户认为服务器或连接不复存活之前处理的无服务器响应的SIGALRM总数。变量nprobes计量从收到来自服务器的最后一个应答以来处理的SIGALRM数目。

heartbeat_cli函数 8-20  heartbeat_cli函数检查并保存参数,给SIGURG和SIGALRM建立信号处理函数,并把套接字的属主设置为本进程ID。执行alarm以调度第一个SIGALRM.

SIGURG处理函数 21-32   本信号在某个带外通知到达时产生。我们尝试读入相应的带外字节,不过如果它还没有到达(EWOULDBLOCK),那也没有关系。注意,我们不采用在线接收带外数据方式,因为这种方式会干扰客户读取它的正常数据。既然服务器仍然存活着,我们把nprobes重置为0.

SIGALRM处理函数 33-43   本信号以恒定的间隔产生。递增计数器nprobes,如果达到maxnprobes,我们就认定服务器主机或者已经崩溃,或者不再可达。我们这里是直接结束客户进程。作为带外数据发送一个含有字符1的字节(该值没有任何隐含意义),再执行alarm调度下一个SIGALRM。

下面是服务器程序的心搏函数。

  1. #include "unp.h"
  2. static int servfd;
  3. static int nsec; /* #seconds between each alarm */
  4. static int maxnalarms; /* #alarms w/no client probe before quit */
  5. static int nprobes; /* #alarms since last client probe */
  6. static void sig_urg(int), sig_alrm(int);
  7. void heartbeat_serv(int servfd_arg, int nsec_arg, int maxnalarms_arg)
  8. {
  9. servfd = servfd_arg; /* set globals for signal handlers */
  10. if( (nsec = nsec_arg) < )
  11. nsec = ;
  12. if( (maxnalarms = maxnalarms_arg) < nsec)
  13. maxnalarms = nsec;
  14. Signal(SIGURG, sig_urg);
  15. Fcntl(servfd, F_SETOWN, getpid());
  16. Signal(SIGALRM, sig_alrm);
  17. alarm(nsec);
  18. }
  19. static void sig_urg(int signo)
  20. { /* 当一个带外通知收到时, 服务器试图读入它。就像客户一样,如果带外字节没有到达没有什么关系。带外字节被作为带外数据返回给客户。注意,如果recv返回EWOULDBLOCK错误,那么自动变量c碰巧是什么就送给客户什么。由于我们不用带外字节的值,所以这没有关系。重要的是发送1字节的带外数据,而不管该字节是什么。由于刚收到通知,客户仍存活,所以重置nprobes为0 */
  21. int n;
  22. char c;
  23. if( (n = recv(servfd, &c, , MSG_OOB)) < )
  24. {
  25. if(errno != EWOULDBLOCK)
  26. err_sys("recv error");
  27. }
  28. Send(servfd, &c, , MSG_OOB); /* echo back out-of-hand byte */
  29. nprobes = ; /* reset counter */
  30. return; /* may interrupt server code */
  31. }
  32. static void sig_alrm(int signo)
  33. { /* nprobes增1, 如果它到达了调用者指定的值maxnalarms,服务器进程将被终止。否则调度一下SIGALRM */
  34. if( ++nprobes > maxnalarms)
  35. {
  36. printf("no probes from client\n");
  37. exit();
  38. }
  39. alarm(nsec);
  40. return; /* may interrupt server code */
  41. }

heartbeat_serv函数 7-18    声明变量,函数heartbeat_serv几乎与客户的心搏初始化函数一样。

SIGURG处理函数 19-31   服务器收到一个带外通知后就尝试读入相应的带外字节。就像客户一样,如果该带外字节还没有到达,那也没有声明关系。服务器把读入的带外字节作为带外数据回送给客户。注意,如果recv返回EWOULDBLOCK错误,那么自动变量C碰巧是什么就回送什么。既然我们不把带外字节的值用于任何目的,这么处置就不会有问题。重要的是发送1字节的带外数据本身,而不是该字节到底是什么。既然刚收到客户仍然存活着的通知,我们把nprobes重置为0.

SIGALRM处理函数 32-41    递增nprobes,如果达到由调用者指定的maxnalarms值,那就终止服务器进程,否则调度下一个SIGALRM。

http://blog.csdn.net/ctthuangcheng/article/details/9569265

UNIX网络编程——客户/服务器心搏函数 (转)的更多相关文章

  1. UNIX网络编程——客户/服务器心搏函数

    阅读此博客时,可以参考以前的博客<<UNIX网络编程--socket的keep-alive>>和<<UNIX网络编程--套接字选项(心跳检测.绑定地址复用)> ...

  2. UNIX网络编程——客户/服务器程序设计示范(总结)

    (1)当系统负载较轻是,每来一个客户请求现场派生一个子进程为之服务的传统并发服务器程序模型就足够了.这个模型甚至可以与inetd结合使用,也就是inetd处理每个连接的接收.我们的其他意见是就重负荷运 ...

  3. UNIX网络编程——客户/服务器程序设计示范(七)

        TCP预先创建线程服务器程序,每个线程各自accept 前面讨论过预先派生一个子进程池快于为每个客户线程派生一个子进程.在支持线程的系统上,我们有理由预期在服务器启动阶段预先创建一个线程池以取 ...

  4. UNIX网络编程——客户/服务器程序设计示范(六)

    TCP并发服务器程序,每个客户一个线程 前面讲述了,每个客户一个进程的服务器,或为每个客户现场fork一个子进程,或者预先派生一定数目的子进程.如果服务器主机支持线程,我们就可以改用线程以取代子进程. ...

  5. UNIX网络编程——客户/服务器程序设计示范(五)

        TCP预先派生子进程服务器程序,传递描述符 对预先派生子进程服务器程序的最后一个修改版本是只让父进程调用accept,然后把所接受的已连接套接字"传递"给某个子进程.这么做 ...

  6. UNIX网络编程——客户/服务器程序设计示范(三)

    TCP预先派生子进程服务器程序,accept无上锁保护 我们的第一个"增强"型服务器程序使用称为预先派生子进程的技术.使用该技术的服务器不像传统意义的并发服务器那样为每个客户现场派 ...

  7. UNIX网络编程——客户/服务器程序设计示范(二)

        TCP并发服务器程序,每个客户一个子进程 传统上并发服务器调用fork派生一个子进程来处理每个客户.这使得服务器能够同时为多个客户服务,每个进程一个客户.客户数目的唯一限制是操作系统对以其名义 ...

  8. UNIX网络编程——客户/服务器程序设计示范(八)

        TCP预先创建线程服务器程序,主线程统一accept 最后一个使用线程的服务器程序设计示范是在程序启动阶段创建一个线程池之后只让主线程调用accept并把每个客户连接传递给池中某个可用线程.  ...

  9. UNIX网络编程——客户/服务器程序设计示范(四)

        TCP预先派生子进程服务器程序,accept使用线程上锁保护 我们使用线程上锁保护accept,因为这种方法不仅适用于同一进程内各线程之间的上锁,而且适用于不同进程之间的上锁.        ...

随机推荐

  1. HDU - 4336:Card Collector(min-max容斥求期望)

    In your childhood, do you crazy for collecting the beautiful cards in the snacks? They said that, fo ...

  2. 20179223《Linux内核原理与分析》第二周学习笔记

    第二周实验 本周学习情况: 学习了X86 cpu的几个寄存器及X86汇编指令: movl %eax,%edx edx=eax %表示一个寄存器,把eax内容放入edx,等号相当于把eax赋值给edx, ...

  3. 自动将 NuGet 包的引用方式从 packages.config 升级为 PackageReference

    在前段时间我写了一篇迁移 csproj 格式的博客 将 WPF.UWP 以及其他各种类型的旧样式的 csproj 文件迁移成新样式的 csproj 文件,不过全过程是手工进行的,而且到最后处理 XAM ...

  4. 《DSP using MATLAB》示例Example6.18、6.19

  5. Mac OS安装php-redis扩展

    下载php-redis(用于php5.x的版本),地址:https://nodeload.github.com/nicolasff/phpredis/zip/master. 如果是php7.2,选择p ...

  6. 从hello world 说程序运行机制

    转自:http://www.cnblogs.com/yanlingyin/archive/2012/03/05/2379199.html 开篇 学习任何一门编程语言,都会从hello world 开始 ...

  7. express中session的存储与销毁

    1.首先在使用session之前需要先配置session的过期时间等,在入口文件app.js中 app.use(express.session({ cookie: { maxAge: config.g ...

  8. luvit 被忽视的lua 高性能框架(仿nodejs)

    备注:       luvit  开放模式和nodejs 一样,但是因为生态以及小众语言的问题,使用的人比较少,但是从目前     来看更新速度还是比较快的,但是从现有lua 开发框架来说一般倾向于使 ...

  9. MySQL5.6版本性能调优my.cnf详解

    [client] port = 3306 socket = /tmp/mysql.sock [mysqld] port = 3306 socket = /tmp/mysql.sock basedir  ...

  10. Virsh中创建虚拟机两种方式define和create的区别

    本质上两者一样的,都是从xml配置文件创建虚拟机 define  丛xml配置文件创建主机但是不启动 create  同样是丛xml配置文件创建主机,但是可以指定很多选项,比如是否启动,是否连接控制台 ...