一次失败的PHP扩展开发之旅

By warezhou 2014.11.19

缘起

经过不断的持续迭代。我们部门的协程版网络框架(CoSvrFrame)最终出炉了!这本来是件喜大普奔的事情。可是随着新业务的不断接入,非常多固有缺陷也逐渐浮出水面:

  • 不支持“TCP连接池”
  • 不支持“Dispatcher-Workers模型”
  • 不支持“过载保护”
  • 不支持“热重新启动”
  • 不支持“64Bit”
  • ... ...

对于资深后台开发而言。上面罗列的问题大多数都难入法眼,之所以成为问题,非常有点“温水煮青蛙”的味道:迭代过程缺乏宏观视野,引入过多业务特性,导致总体架构不合理。近期的“协程版本号”最初也是我个人业余之作,只为了可以愉快地写业务代码,为了快点出活,底层直接复用原有SvrFrame,结果可想而知:根基不牢,地动山摇。以最极端的64Bit为例。相信大家秒懂了。

经过多番调研与讨论。终于我们给出了例如以下前进方向:

  • 引入公司内部开源的SPP3.0框架,吸收它的基础周边设施,进行业务二次开发
  • 对于SPP进行扩展。支持PHP作为脚本语言进行嵌入式编程。同一时候以C扩展形式给PHP提供协程能力(从此PHPer也能够愉快地书写异步代码了,妈妈再也不用操心我的callback了!

叨逼叨啰嗦了这么久,以下能够切入主题了:怎样实现C++/PHP混合编程?

免责申明:因为本人属于半路出家。接触PHP扩展开发尚未足周,因此无法深入到WHY,仅能停留在HOW。仅作记录之用,望高手见谅!

开场

嵌入式PHP

业内C++/PHP的结合。通常是出于“性能”考虑,在PHP代码里调用C/C++扩展,从而解决特定的性能瓶颈(如PB序列化等)。

作为C/C++开发出身。“开发效率”相对于“性能”的诱惑显然更大,因此。我们的思路是:将PHP作为脚本语言。高速开发业务逻辑,插入到SPP框架执行。

1. 以RTLD_GLOBAL方式打开php动态库

void *php_handler = dlopen("libphp5.so", RTLD_LAZY | RTLD_GLOBAL);
if (!php_handler) {
base->log_.LOG_P_PID(LOG_FATAL, "%s\n", dlerror());
return -1;
}
dlclose(php_handler);

2. 通过php_embed_init进行初始化

php_embed_module.php_ini_path_override = "../php/php.ini";
php_embed_init(0, NULL);

3. 通过zend_eval_string引入PHP脚本

zend_first_try {
char exec_str[256];
snprintf(exec_str, sizeof(exec_str), "include '%s';", "../php/demo_handler.php");
if (int ret = zend_eval_string(exec_str, NULL, exec_str TSRMLS_CC)) {
base->log_.LOG_P_PID(LOG_FATAL, "zend_eval_string fail. ret=%d\n", ret);
return -1;
}
base->log_.LOG_P_PID(LOG_DEBUG, "zend_eval_string succ.\n");
} zend_catch {
base->log_.LOG_P_PID(LOG_FATAL, "zend_eval_string catch.\n");
} zend_end_try ();

4. 通过call_user_function回调PHP函数

zval z_funcname;
ZVAL_STRING(&z_funcname, "EchoDemo::init", 1); zval *zp_svr;
MAKE_STD_ZVAL(zp_svr);
ZVAL_LONG(zp_svr, (long)base); zval *zp_etc;
MAKE_STD_ZVAL(zp_etc);
ZVAL_STRING(zp_etc, etc, 1); zval z_retval;
zval *z_params[] = {zp_svr, zp_etc};
int call_ret = call_user_function(CG(function_table), NULL, &z_funcname, &z_retval, sizeof(z_params) / sizeof(z_params[0]), z_params TSRM convert_to_long(&z_retval);
int func_ret = Z_LVAL_P(&z_retval); zval_ptr_dtor(&zp_etc);
zval_dtor(&z_funcname);
zval_dtor(&z_retval); if (call_ret < 0 || func_ret < 0) {
base->log_.LOG_P_PID(LOG_FATAL, "call_user_function fail. call_ret=%d func_ret=%d\n", call_ret, func_ret);
return -1;
}

5. 通过php_embed_shutdown进行清理

php_embed_shutdown(TSRMLS_C);

PHP扩展

网络上关于PHP的C扩展开发文章能够说已经到泛滥的地步了。有兴趣的读者能够深入阅读文末的附录。

1. 下载php源代码包,进行手动编译。为了配合上述嵌入式使用,须要打开—enable-embed选项

./configure --enable-embed
make
make install(可选)

2. 进入php源代码包的ext文件夹。借助ext_skel工具生成插件架子代码

cd ext
./ext_skel --extname=demo

3. 编辑config.m4,打开PHP_ARG_WITH或者PHP_ARG_ENABLE选项(说实话差别仍没搞清楚,求达人指点)。加入C++支持、依赖路径等

PHP_ARG_ENABLE(demo, whether to enable demo support,
[ --enable-demo Enable demo support]) if test "$PHP_DEMO" != "no"; then
PHP_REQUIRE_CXX()
PHP_ADD_LIBRARY(stdc++, 1, EXTRA_LDFLAGS) PHP_ADD_INCLUDE(/root/spp/module/include/)
PHP_ADD_INCLUDE(/root/spp/module/include/spp_incl/) PHP_NEW_EXTENSION(demo, demo.cpp, $ext_shared)
fi

4. 编辑demo.cpp,加入扩展定义和实现(函数、类、变量 ...),这里只给出函数定义演示样例,类相关的有兴趣的读者自行依据附录摸索。这里给出的sendrecv函数定义比較有代表性,当中第3个參数rsp为引用參数,负责将接收到的数据返回给PHP调用方

ZEND_BEGIN_ARG_INFO_EX(arginfo_sendrecv, 0, 0, 7)
ZEND_ARG_INFO(0, req)
ZEND_ARG_INFO(0, req_len)
ZEND_ARG_INFO(1, rsp)
ZEND_ARG_INFO(0, rsp_len)
ZEND_ARG_INFO(0, ip)
ZEND_ARG_INFO(0, port)
ZEND_ARG_INFO(0, timeout)
ZEND_END_ARG_INFO()
PHP_FUNCTION(sendrecv)
{
char *req = NULL;
int req_str_len = 0;
long req_len = 0;
zval *rsp = NULL;
long rsp_len = 0;
char *ip = NULL;
int ip_str_len = 0;
long port = 0;
long timeout = 0;
if (zend_parse_parameters(ZEND_NUM_ARGS() TSRMLS_CC, "slzlsll", &req, &req_str_len,
&req_len, &rsp, &rsp_len, &ip, &ip_str_len, &port, &timeout) == FAILURE) {
return;
}
struct sockaddr_in addr;
memset(&addr, 0, sizeof(addr));
addr.sin_family = AF_INET;
addr.sin_addr.s_addr = inet_addr(std::string(ip, ip_str_len).c_str());
addr.sin_port = htons(port);
char *rsp_buf = (char *)emalloc(rsp_len);
int rsp_buf_len = rsp_len;
if (int ret = mt_udpsendrcv(&addr, req, req_len > req_str_len ? req_str_len : req_len, rsp_buf, rsp_buf_len, timeout)) {
efree(rsp_buf);
RETURN_LONG(ret);
}
zval_dtor(rsp);
ZVAL_STRINGL(rsp, rsp_buf, rsp_buf_len, 0);
RETURN_LONG(0);
}
const zend_function_entry demo_functions[] = {
PHP_FE(sendrecv, arginfo_sendrecv)
PHP_FE_END /* Must be the last line in demo_functions[] */
};

5. 一切准备就绪,能够编译扩展了,我个人比較喜欢动态编译(静态编译须要又一次编译php源代码。太耗时费力),生成的.so位于当前扩展的modules文件夹下

/usr/local/bin/phpize
./configure --with-php-config=/usr/local/bin/php-config
make

6. 编辑php.ini文件,加入新的扩展,然后就能够愉快地在PHP代码中调用新扩展了

extension_dir="/somewhere/modules"
extension="demo.so"
extension="xxxx.so"

高潮

最终到了组装成型的时刻了,通过telnet玩了几把EchoDemo,看到一行一行的回显,不禁心情大好。

<?php
class EchoDemo {
public static function init($server, $conf) {
log_debug($server, "init in php.\n");
return true;
} public static function input($server, $req, $ext_info = array()) {
log_debug($server, "input in php.\n");
return strlen($req);
} public static function route($server, $req, $ext_info = array()) {
log_debug($server, "route in php.\n");
return 1;
} public static function process($server, $req, $ext_info = array()) {
log_debug($server, "process in php.\n");
$ret = sendrecv($req, strlen($req), $rsp, 65535, "127.0.0.1", 2345, 500);
if ($ret != 0) {
log_debug($server, "sendrecv fail. ret=$ret");
return false;
}
log_debug($server, "sendrecv finish. rsp=$rsp");
return true;
} public static function fini($server) {
log_debug($server, "fini in php.\n");
}
}
?>

这里最值得赞叹的就是process函数对于sendrecv扩展调用,这里背后通过协程事实上已经实现了一次异步网络交互:既能像同步CGI般书写逻辑代码。又能无痛地享受异步的高并发。

愿望是美好的。现实是残酷的!

我这时突然心血来潮:来压測一把性能吧,看看相比于原生C++代码有多大的性能衰减。单次请求1KB,施以1w/s的压力,压了一会coredump了。

内存泄漏?协程栈溢出?...

期间各种折腾:GDB,改动协程栈大小。Google,咨询PHPer ...

非常快到了晚上。该查的都查过了,该问的都问过了,实在没辙了,停下来喝杯茶:“call_user_function可重入么”?想到这一层,相信了解协程本质的兄弟又秒懂了:你妹的。人家实现Zend的时候怎么知道调用线程还会玩协程进行用户态调度啊,这个黑盒里面一切皆有可能啊!全局变量、静态变量
...

好吧,去掉sendrecv这类基于协程的扩展,又一次压測,单worker对于3w/s的echo还是轻松无压力的。

结局

尽管这次最吸引人的一个Feature终于未能实现,只是我还是非常开心,由于再次印证了一个观点:思考往往比蛮干高效百倍,尤其在处理棘手问题时,无头苍蝇般乱闯乱撞往往费力不讨好。此时。假设可以冷静下来,尽力搜集现有知识储备。说不定灵感就来光顾你了。

未来可能的方向:PHP从5.5版本号引入了yield。感觉假设挖掘出来Zend对于yield的支持细节。说不定有希望和我们的C框架非常好的融合。可是总认为是个填不平的大坑。假设抛开其他因素,或许我还是希望选择Golang一类语言直接享受goroutine的优势吧。哈哈!

附录

PHP扩展开发及内核应用
编译PHP扩展的两种方式
怎样使用C++开发PHP扩展(上)
怎样使用C++开发PHP扩展(下)
Wrapping C++ Classes in a PHP Extension

一次失败的PHP扩展开发之旅的更多相关文章

  1. Cocos2d-x 3.x游戏开发之旅

    Cocos2d-x 3.x游戏开发之旅 钟迪龙 著   ISBN 978-7-121-24276-2 2014年10月出版 定价:79.00元 516页 16开 内容提要 <Cocos2d-x ...

  2. ArcGIS Engine开发之旅04---ARCGIS接口详细说明

    原文:ArcGIS Engine开发之旅04---ARCGIS接口详细说明 ArcGIS接口详细说明... 1 1.      IField接口(esriGeoDatabase)... 2 2.    ...

  3. Android开发之旅: Intents和Intent Filters(理论部分)

    引言 大部分移动设备平台上的应用程序都运行在他们自己的沙盒中.他们彼此之间互相隔离,并且严格限制应用程序与硬件和原始组件之间的交互. 我们知道交流是多么的重要,作为一个孤岛没有交流的东西,一定毫无意义 ...

  4. ArcGIS Engine开发之旅08--和查询相关的对象和接口

    原文:ArcGIS Engine开发之旅08--和查询相关的对象和接口 查询在GIS领域应该是一个很频繁的操作,在GIS中除了具有属性查询(和其他关系型数据库的查询类似),还提供了空间查询.在介绍查询 ...

  5. ArcGIS Engine开发之旅05---空间数据库

    原文:ArcGIS Engine开发之旅05---空间数据库 1  Geodatabase概念 Geodatabase是ArcInfo8引入的一种全新的面向对象的空间数据模型,是建立在DBMS之上的统 ...

  6. ArcGIS Engine开发之旅03--ArcGIS Engine中的控件

    原文:ArcGIS Engine开发之旅03--ArcGIS Engine中的控件 制图控件,如MapControl.PageLayoutControl,其中MapControl控件主要用于地理数据的 ...

  7. ArcGIS Engine开发之旅02--ArcGIS Engine中的类库

    原文:ArcGIS Engine开发之旅02--ArcGIS Engine中的类库 System类库 System类库是ArcGIS体系结构中最底层的类库.System类库包含给构成ArcGIS的其他 ...

  8. ArcGIS Engine开发之旅01---产品组成、逻辑体系结构

    原文:ArcGIS Engine开发之旅01---产品组成.逻辑体系结构 ArcGIS Engine 由两个产品组成:  面向开发人员的软件开发包(ArcGIS Engine Developer k ...

  9. Android 开发之旅:深入分析布局文件&又是“Hello World!”

    http://www.cnblogs.com/skynet/archive/2010/05/20/1740277.html 引言 上篇可以说是一个分水岭,它标志着我们从Android应用程序理论进入实 ...

随机推荐

  1. 无滚动条GridView少量图片展示

    import android.content.Context; import android.util.AttributeSet; import android.util.Log; import an ...

  2. ACM训练联盟周赛(第一场)

    B:Zeratul与Xor 题目描述 Xor(按位异或),对应C++中的“^”运算符. Zeratul给出了一个数列A[n](n≤105),要做q(q≤105)组动作,这些动作包括: 1  a:数列中 ...

  3. AIX 6.1 Oracle 10G 数据库GoldenGate实施

    安装环境说明: 源端:AIX 6.1 10.190.1.215 目标端:Linux 10.191.1.10 1:源端创建goldengate 表空间. 表空间的要求:最小500m,大点3-5G,设置自 ...

  4. 学习Go语言之简易ORM框架

    ORM即为对象关系映射,ORM常用于程序适配多种数据库,以达到开放扩展关闭修改的原则.笔者初学Golang,遂有意写个简易ORM框架,权当知识巩固. 首先需要有一个思想就是数据库表结构都是固定,但是每 ...

  5. Ubuntu下Matlab代码中中文注释乱码解决方案

    环境:Ubuntu18.04,Matlab R2017b. 把matlab文件从windows拷贝到Ubuntu中,打开发现原先的中文注释全部乱码.真正原因是因为windows中.m文件采用的是gbk ...

  6. 一 梳理 从 HDFS 到 MR。

      MapReduce 不仅仅是一个工具,更是一个框架.我们必须拿问题解决方案去适配框架的 map 和 reduce 过程   很多情况下,需要关注 MapReduce 作业所需要的系统资源,尤其是集 ...

  7. 二叉树、B树、B+树、B*树、LSM树

      HBase 对于数据产品,底层存储架构直接决定了数据库的特性和使用场景.RDBMS(关系型数据库)使用 B树 及 B+树 作为数据存储结构. HBase 使用 LSM树. .     二叉树    ...

  8. 警惕 InnoDB 和 MyISAM 创建 Hash 索引陷阱

    MySql 最经常使用存储引擎 InnoDB 和 MyISAM 都不支持 Hash 索引,它们默认的索引都是 B-Tree.可是假设你在创建索引的时候定义其类型为 Hash,MySql 并不会报错,并 ...

  9. BitSet的使用

    有些程序须要处理二进制有序集,标准库提供了bitset 类型,其实,bitset 是一个二进制容器.容器中每个元素都是一位二进制码,或为 0,或为 1. bitset除了能够訪问指定下标的bit位以外 ...

  10. 如何下载最新版的 Adobe Flash Player

    如何下载最新版的 Adobe Flash Player 中国访客用代理访问下面的链接,否则会自动跳转到 https://www.flash.cn/ 当我们从 https://get.adobe.com ...