前提概要

当需要同时处理多个url时,可采用curl_multi_perform方式执行,如下代码1:

     //初始化一个multi curl 对象
CURLM * curl_m = curl_multi_init();
CURL * my_curl[CURL_NUM];
char rcvbuf[CURL_NUM][MAXHEADLEN] = { };
//其他初始化代码略过... //执行多个url
while(running_handles)
{
if (- == curl_multi_select(curl_m))
{
printf("curl_multi_select error !\n");
break;
}
else {
// select监听到事件,调用curl_multi_perform通知curl执行相应的操作 //
while (CURLM_CALL_MULTI_PERFORM == curl_multi_perform(curl_m, &running_handles));
}
} //解析数据
int msgs_left;
CURLMsg * curl_msg;
while((curl_msg = curl_multi_info_read(curl_m, &msgs_left)))
{
if (CURLMSG_DONE == curl_msg->msg)
{
int idx;
for (idx = ; idx < CURL_NUM; ++idx)
{
if (curl_msg->easy_handle == my_curl[idx]) break;
} if (idx == CURL_NUM)
{
printf("curl not found !\n" );
}
else
{
printf("\ncurl[%d] rcvbuf:\n%s\n", idx,rcvbuf[idx]);
//数据处理...
}
}
}

问题概要

现在我的url为订阅方式,每个curl都会一直收数据(即使没数据也会每10s收到一帧心跳消息),永远不会退出,即上面的循环永远在执行,这样我无法运行到"解析数据"那一步。所以我需要在循环内判断某个curl是否有新数据到来。

方法1(不行)

首先想到的方法是直接将curl_multi_info_read()函数直接移到循环内,看是否能受到数据,如下代码2:

     //执行多个url,并解析数据
while(running_handles)
{
if (- == curl_multi_select(curl_m))
{
printf("curl_multi_select error !\n");
break;
}
else {
// select监听到事件,调用curl_multi_perform通知curl执行相应的操作 //
while (CURLM_CALL_MULTI_PERFORM == curl_multi_perform(curl_m, &running_handles));
//检测哪一个curl[idx]来的数据
while ((curl_msg = curl_multi_info_read(curl_m, &msgs_left)))
{
if (CURLMSG_DONE == curl_msg->msg)
{
int idx;
for (idx = ; idx < CURL_NUM; ++idx)
{
if (curl_msg->easy_handle == my_curl[idx]) break;
}
if (idx == CURL_NUM)
{
printf("curl not found !\n" );
}
else
{
printf("\ncurl[%d] rcvbuf:\n%s\n", idx,rcvbuf[idx]);
//数据处理...
memset(rcvbuf[idx], , sizeof(rcvbuf[idx]));//清空buf下轮循环还要用
}
}
}
}
}

显然是我想多了,这样处理之后唯一的不同就是,哪个curl执行完了就打印哪个的数据(代码1的是只能等到所有的curl都执行完毕退出循环后依次打印rcvbuf[idx]),但我的curl是订阅的,根本执行不完,这样也没法打印,除非rcvbuf[idx]溢出...

方法2(暂时不行)

  rcvbuf[idx]溢出?这样肯定不可能,但是让我想起了curl_easy_setopt()函数,这货可以配置curl的各种功能,或许总有一个能满足我吧:

CURLOPT_TIMEOUT_MS 配置超时时间?
    不对,这个是要超时了curl直接挂了;
CURLOPT_RANGE 配置断点续传?
    貌似可以;通过测试发现收指定XX个字节满了后该curl就退出了,即使后面还有数据他也不要了,这不是我们想看到的。
还有一个接收超时时间的配置?
    同上,超过多少s后即使还有数据他也不要了,也不行。
...

相信通过配置curl_easy_setopt()函数应该是最官方的做法,但小弟不才没有找到相关文章,自己研究也没搞出来,有待高人指点。

方法3(可行,有缺陷)

万般无奈之下,突然想到既然curl[idx]收到的数据在rcvbuf[idx]中,为何不直接检查rcvbuf[idx]中有没有数据,如下代码3:

     //执行多个url,并解析数据
while(running_handles)
{
if (- == curl_multi_select(curl_m))
{
printf("curl_multi_select error !\n");
break;
}
else {
// select监听到事件,调用curl_multi_perform通知curl执行相应的操作 //
while (CURLM_CALL_MULTI_PERFORM == curl_multi_perform(curl_m, &running_handles));
//检测哪一个curl[idx]来的数据
int idx = ;
for (idx = ; idx < CURL_NUM; ++idx)
{
if (rcvbuf[idx][] == NULL) //curl[idx]没有收到数据。
continue;
printf("curl[%d] rcvbuf:\n%s\n", idx, rcvbuf[idx]);
//数据处理...
memset(rcvbuf[idx], , sizeof(rcvbuf[idx]));
}
}
}

通过上面的处理确实能满足要求,但是方法有些笨,存在2个明显的缺陷:
  1. 每次都要检测所有的curl一遍,效率低;
  2. 一旦某个curl因某种原因死掉了,我该如何判断是哪一个curl挂了?

所以处理这个问题是否有官方的方法?还有待高人解答,保持关注更新。

libcurl 中使用curl_multi_perform()函数执行订阅类型url的问题的更多相关文章

  1. 【C#】C#中方法(函数)的类型有哪些

    目录结构: contents structure [+] 构造函数 引用类型的构造函数 值类型的构造函数 析构函数 析构函数的使用 析构函数和Dispose()方法的区别 操作符重载 转化操作符方法 ...

  2. Jquery Mobile中pageinit等函数执行两次的问题【终极解决】

    当禁用了jqueryMobile的ajax后,初始化函数如pageinit和pageshow等函数,都会执行两次.document.ready函数也会执行两次. 当然我们可以用一个变量记录是否已经执行 ...

  3. plv8 中使用 eval 函数执行表达式计算

    在js 开发中我们都说eval 函数是邪恶的,但是此函数也有好多妙用,以下是几个简单的案例 eval 执行基于js 的表达式计算 比如我们有以下表 CREATE TABLE rules (    id ...

  4. 在Loadrunner中如何用system函数执行系统命令

    前提: windows 系统 实现功能:用 LR 中的system函数执行系统命令 相关功能:在LR中利用C函数建立文件,写文件,读文件. 主要相关函数:sprintf/fopen/fgetc/fre ...

  5. C++构造与析构函数中调用虚函数的问题

    前些天想把以前写的内存池算法重写一遍,跨平台是第一目标,当时突发奇想,因为不愿意做成一大堆#if..#end,所以想利用C++的多态性,但是怎么让内存池完好退出却没想到自认为完美的方案.但是一个很偶然 ...

  6. PHP中的CURL函数库

    PHP中的CURL函数库(Client URL Library Function) curl_close — 关闭一个curl会话curl_copy_handle — 拷贝一个curl连接资源的所有内 ...

  7. 关于js中的回调函数callback

    来源于:http://www.jianshu.com/p/6bc353e5f7a3 前言 其实我一直很困惑关于js 中的callback,困惑的原因是,学习中这块看的资料少,但是平时又经常见,偶尔复制 ...

  8. 关于 js 中的回调函数 callback

    本文写于1年前 曾经的学习文章如今拿出来分享 前言 其实我一直很困惑关于js中的callback,困惑的原因是,学习中这块看的资料少,但是平时又经常见,偶尔复制一下前人代码,功能实现了也就不再去追其原 ...

  9. golang函数——可以为类型(包括内置数据类型)定义函数,类似类方法,同时支持多返回值

    不可或缺的函数,在Go中定义函数的方式如下: func (p myType ) funcName ( a, b int , c string ) ( r , s int ) { return } 通过 ...

随机推荐

  1. ELK 实用架构

  2. 洛谷 P3239 / loj 2112 [HNOI2015] 亚瑟王 题解【期望】【DP】

    ???看不懂的期望DP 题目描述 小 K 不慎被 LL 邪教洗脑了,洗脑程度深到他甚至想要从亚瑟王邪教中脱坑. 他决定,在脱坑之前,最后再来打一盘亚瑟王.既然是最后一战,就一定要打得漂亮.众所周知,亚 ...

  3. 2018南京icpc现场赛心得

    第一次参加icpc的比赛,也是第一块奖牌,虽然只是铜,但其实打的已经很好了,稍微差一点就可以摸银了. 之前参加省赛,成为那次比赛我校唯一一个没拿奖的队伍,其实还是一直都有一些心结的,而这段时间和新的队 ...

  4. DictionaryHelper2

    /// <summary> /// DictionaryHelper /// </summary> public static class DictionaryHelper { ...

  5. Oracle 11g使用DML Error Logging来避免bulk insert故障

    当使用带有子查询的insert语句来加载数据时如果出现错误.系统会终止该语句并回滚整个操作.这是非常消耗时间和资源的操作.如果insert这样的语句可以使用DML Error Logging功能来避免 ...

  6. Oracle Purge和drop的区别

    转自: http://www.cnblogs.com/HondaHsu/archive/2012/09/28/2707487.html 最近发现oracle中出现了这些奇怪的表名,上网查找后发现是or ...

  7. Python+Selenium操作select下拉框

    首先需要倒入Select模块: from selenium.webdriver.support.select import Select 常用方法: 通过索引定位:select_by_index() ...

  8. MHA 高可用架构部署

    一, MHA 介绍 MHA(Master High Availability)目前在MySQL高可用方面是一个相对成熟的解决方案,它由日本DeNA公司youshimaton(现就职于Facebook公 ...

  9. ansible 命令详解{图片详解}

    本文内容来至于http://www.zsythink.net 文件操作模块 命令操作模块 cron 包管理模块      

  10. Rancher2.0 外置存储卷

    一,环境准备 01,基础环境 一台rancher集群 服务器搭建参考原先文章 >>飞机直达 一台nfs服务器 02,nfs服务器搭建 rpm -qa rpcbind|grep rpcbin ...