PHP与Golang如何通信?

最近遇到的一个场景:php项目中需要使用一个第三方的功能(结巴分词),而github上面恰好有一个用Golang写好的类库。那么问题就来了,要如何实现不同语言之间的通信呢?

常规的方案:

  • 用Golang写一个http/TCP服务,php通过http/TCP与Golang通信
  • 将Golang经过较多封装,做为php扩展。
  • PHP通过系统命令,调取Golang的可执行文件

存在的问题:

  • http请求,网络I/O将会消耗大量时间
  • 需要封装大量代码
  • PHP每调取一次Golang程序,就需要一次初始化,时间消耗很多

优化目标:

  • Golang程序只初始化一次(因为初始化很耗时)
  • 所有请求不需要走网络
  • 尽量不大量修改代码

解决方案:

  • 简单的Golang封装,将第三方类库编译生成为一个可执行文件
  • PHP与Golang通过双向管道通信

使用双向管道通信优势:

1:只需要对原有Golang类库进行很少的封装
2:性能最佳 (IPC通信是进程间通信的最佳途径)
3:不需要走网络请求,节约大量时间
4:程序只需初始化一次,并一直保持在内存中

具体实现步骤:

  • 1:类库中的原始调取demo

    1. package main
    2. import (
    3. "fmt"
    4. "github.com/yanyiwu/gojieba"
    5. "strings"
    6. )
    7.  
    8. func main() {
    9. x := gojieba.NewJieba()
    10. defer x.Free()
    11.  
    12. s := "小明硕士毕业于中国科学院计算所,后在日本京都大学深造"
    13. words := x.CutForSearch(s, true)
    14. fmt.Println(strings.Join(words, "/"))
    15. }

    保存文件为main.go,就可以运行

  • 2:调整后代码为:

    1.    package main
    2. import (
    3. "bufio"
    4. "fmt"
    5. "github.com/yanyiwu/gojieba"
    6. "io"
    7. "os"
    8. "strings"
    9. )
    10.  
    11. func main() {
    12.  
    13. x := gojieba.NewJieba(
    14. "/data/tmp/jiebaDict/jieba.dict.utf8",
    15. "/data/tmp/jiebaDict/hmm_model.utf8",
    16. "/data/tmp/jiebaDict/user.dict.utf8"
    17. )
    18. defer x.Free()
    19.  
    20. inputReader := bufio.NewReader(os.Stdin)
    21. for {
    22. s, err := inputReader.ReadString('\n')
    23. if err != nil && err == io.EOF {
    24. break
    25. }
    26. s = strings.TrimSpace(s)
    27.  
    28. if s != "" {
    29. words := x.CutForSearch(s, true)
    30. fmt.Println(strings.Join(words, " "))
    31. } else {
    32. fmt.Println("get empty \n")
    33. }
    34. }
    35. }

    只需要简单的几行调整,即可实现:从标准输入接收字符串,经过分词再输出
    测试:

    1. # go build test
    2. # ./test
    3. # //等待用户输入,输入”这是一个测试“
    4. # 这是 一个 测试 //程序
  • 3:使用cat与Golang通信做简单测试

    1. //准备一个title.txt,每行是一句文本
    1. # cat title.txt | ./test

    正常输出,表示cat已经可以和Golang正常交互了

  • 4:PHP与Golang通信
      以上所示的cat与Golang通信,使用的是单向管道。即:只能从cat向Golang传入数据,Golang输出的数据并没有传回给cat,而是直接输出到屏幕。但文中的需求是:php与Golang通信。即php要传数据给Golang,同时Golang也必须把执行结果返回给php。因此,需要引入双向管道。
      在PHP中管道的使用:popen("/path/test"),具体就不展开说了,因为此方法解决不了文中的问题。
    双向管道:

    1. $descriptorspec = array(
    2. 0 => array("pipe", "r"),
    3. 1 => array("pipe", "w")
    4. );
    5. $handle = proc_open(
    6. '/webroot/go/src/test/test',
    7. $descriptorspec,
    8. $pipes
    9. );
    10. fwrite($pipes['0'], "这是一个测试文本\n");
    11. echo fgets($pipes[1]);

    解释:使用proc_open打开一个进程,调用Golang程序。同时返回一个双向管道pipes数组,php向$pipe['0']中写数据,从$pipe['1']中读数据。

好吧,也许你已经发现,我是标题档,这里重点要讲的并不只是PHP与Golang如何通信。而是在介绍一种方法: 通过双向管道让任意语言通信。(所有语言都会实现管道相关内容)

测试:

通过对比测试,计算出各个流程占用的时间。下面提到的title.txt文件,包含100万行文本,每行文本是从b2b平台取的商品标题

1: 整体流程耗时

  1. # time cat title.txt | ./test > /dev/null

耗时:14.819秒,消耗时间包含:

  • 进程cat读出文本
  • 通过管道将数据传入Golang
  • Golang处理数据,将结果返回到屏幕

2:计算分词函数耗时。方案:去除分词函数的调取,即:注释掉Golang源代码中的调取分词那行的代码

  1. time cat title.txt | ./test > /dev/null

耗时:1.817秒时间,消耗时间包含:

  • 进程cat读出文本
  • 通过管道将数据传入Golang
  • Golang处理数据,将结果返回到屏幕

分词耗时 = (第一步耗时) - (以上命令所耗时)
分词耗时 : 14.819 - 1.817 = 13.002秒

3:测试cat进程与Golang进程之间通信所占时间

  1. time cat title.txt > /dev/null

耗时:0.015秒,消耗时间包含:

  • 进程cat读出文本
  • 通过管道将数据传入Golang
  • go处理数据,将结果返回到屏幕

管道通信耗时:(第二步耗时) - (第三步耗时)
管道通信耗时: 1.817 - 0.015 = 1.802秒

4:PHP与Golang通信的时间消耗
编写简单的php文件:

  1.   <?php
  2. $descriptorspec = array(
  3. 0 => array("pipe", "r"),
  4. 1 => array("pipe", "w")
  5. );
  6.  
  7. $handle = proc_open(
  8. '/webroot/go/src/test/test',
  9. $descriptorspec,
  10. $pipes
  11. );
  12.  
  13. $fp = fopen("title.txt", "rb");
  14.  
  15. while (!feof($fp)) {
  16. fwrite($pipes['0'], trim(fgets($fp))."\n");
  17. echo fgets($pipes[1]);
  18. }
  19.  
  20. fclose($pipes['0']);
  21. fclose($pipes['1']);
  22. proc_close($handle);

流程与上面基本一致,读出title.txt内容,通过双向管道传入Golang进程分词后,再返回给php (比上面的测试多一步:数据再通过管道返回)

  1. time php popen.php > /dev/null

耗时:24.037秒,消耗时间包含:

  • 进程PHP读出文本
  • 通过管道将数据传入Golang
  • Golang处理数据
  • Golang将返回结果再写入管道,PHP通过管道接收数据
  • 将结果返回到屏幕

结论:

1 :整个分词过程中的耗时分布

  1. 使用cat控制逻辑耗时: 14.819
  2. 使用PHP控制逻辑耗时: 24.037 秒(比cat多一次管道通信)
  3. 单向管道通信耗时: 1.8
  4. Golang中的分词函数耗时: 13.002

2:分词函数的性能: 单进程,100万商品标题分词,耗时13秒 
以上时间只包括分词时间,不包括词典载入时间。但在本方案中,词典只载入一次,所以载入词典时间可以忽略(1秒左右)

3:PHP比cat慢 (这结论有点多余了,呵呵)
语言层面慢: (24.037 - 1.8 - 14.819) / 14.819 = 50%
单进程对比测试的话,应该不会有哪个语言比cat更快。

相关问题:

  • 1:以上Golang源码中写的是一个循环,也就是会一直从管道中读数据。那么存在一个问题:是不是php进程结束后,Golang的进程还会一直存在?

    管道机制自身可解决此问题。管道提供两个接口:读、写。当写进程结束或者意外挂掉时,读进程也会报错,以上Golang源代码中的err逻辑就会执行,Golang进程结束。
    但如果PHP进程没有结束,只是暂时没有数据传入,此时Golang进程会一直等待。直到php结束后,Golang进程才会自动结束。

  • 2:能否多个php进程并行读写同一个管道,Golang进程同时为其服务?

    不可以。管道是单向的,如果多个进程同时向管道中写,那Golang的返回值就会错乱。
    可以多开几个Golang进程实现,每个php进程对应一个Golang进程。

最后,上面都是瞎扯的。如果你了解管道、双向管道,上面的解释对你基本没啥用。但如果你不了解管道,调试上面的代码没问题,但稍有修改就有可能掉坑里。哈哈,推荐一本书吧,《UNIX网络编程》卷一、二,都看一下,也许要看两个月,但很有必要!

多读书、多看报,少看网页,多睡觉!

PHP与Golang如何通信?的更多相关文章

  1. golang RPC通信读写超时设置

    golang RPC通信中,有时候就怕读写hang住. 那是否可以设置读写超时呢? 1.方案一: 设置连接的读写超时 1.1 client RPC通信基于底层网络通信,可以通过设置connection ...

  2. golang协程——通道channel阻塞

    新的一年开始了,不管今天以前发生了什么,向前看,就够了. 说到channel,就一定要说一说线程了.任何实际项目,无论大小,并发是必然存在的.并发的存在,就涉及到线程通信.在当下的开发语言中,线程通讯 ...

  3. Go 通道(channel)与协程间通信

    协程间通信 协程中可以使用共享变量来通信,但是很不提倡这样做,因为这种方式给所有的共享内存的多线程都带来了困难. 在 Go 中有一种特殊的类型,通道(channel),就像一个可以用于发送类型化数据的 ...

  4. deno深入揭秘及未来展望

    deno node.js之父Ryan Dahl在一个月前发起了名为deno的项目,项目的初衷是打造一个基于v8引擎的安全的TypeScript运行时,同时实现HTML5的基础API.所谓的安全运行时, ...

  5. [golang note] 协程通信

    channel基本语法 • channel介绍 √ golang社区口号:不要通过共享内存来通信,而应该通过通信来共享内存. √ golang提供一种基于消息机制而非共享内存的通信模型.消息机制认为每 ...

  6. Golang | 简介channel常见用法,完成goroutin通信

    今天是golang专题的第14篇文章,大家可以点击上方的专辑回顾之前的内容. 今天我们来看看golang当中另一个很重要的概念--信道.我们之前介绍goroutine的时候曾经提过一个问题,当我们启动 ...

  7. grpc基础讲解和golang实现grpc通信小案例

    grpc简介 gRPC由google开发,是一款语言中立.平台中立.开源的远程过程调用系统 gRPC客户端和服务端可以在多种环境中运行和交互,例如用java写一个服务端,可以用go语言写客户端调用 g ...

  8. Golang并发编程进程通信channel了解及简单使用

    概念及作用 channel是一个数据类型,用于实现同步,用于两个协程之间交换数据.goroutine奉行通过通信来共享内存,而不是共享内存来通信.引用类型channel是CSP模式的具体实现,用于多个 ...

  9. java和golang通过protobuf协议相互通信

    目录 整体结构说明 protobuf2文件 golang客户端 目录结构 生成pb.go文件 main.go util.go java服务端 目录结构 pom.xml application.yml ...

随机推荐

  1. PHP global 关键字

    global关键字用于在函数内部访问全局变量. <?php $x = 5; $y = 10; function myTest(){ global $x,$y; $x = $x+$y; } myT ...

  2. React学习系列一

    系列学习react 翻译地址 https://scotch.io/tutorials/learning-react-getting-started-and-concepts 我是初学者,英语也不是很好 ...

  3. 学习ios【1】Objective-C 基本语法

    一 了解一下,找参考资料 1.看书学习object-c语法,第一本看的是<objective-c程序设计>. 2.官网:https://developer.apple.com/librar ...

  4. 怎么把Windows主机上的目录共享到Ubuntu上

    使用Oracle VM VirtualBox在Windows主机上创建了一台Ubuntu虚拟机,怎么把宿主机上的目录共享到Ubuntu上,可使用以下方法: eg.把Windows主机上D盘里的test ...

  5. java向Excel文件写入数据

    /*使用之前要记得导入第三的jar包这个是我之前使用的时候那别人的东西自己修改了一下 还没来得及好好地封装一下还望见谅,注释我感觉写的挺清楚的就在不进行解释代码了*/package com.zzp.E ...

  6. cacti web页面访问 settings出错

    查看apache错误日志: 错误信息Mon Dec 26 11:00:48.241653 2016] [:error] [pid 32607] [client 192.168.10.79:65009] ...

  7. 记一次酷派尚锋Y75刷机

    昨天因为手机卡的原因,我的同学帮他的同学刷机,听他说是用刷机精灵线刷的rom包,但是刷机失败了,就来找我把弄好,他是个半吊子水平,刚接触这个东西,也是运气不好,什么刷机失败的问题都让他遇上了,刷了几个 ...

  8. USACO 2014 JAN 滑雪录像

    2. 滑雪录像{silver题3} [问题描述] 冬奥会的电视时刻表包含N (1 <= N <= 150)个节目,每个节目都有开始和结束时间.农民约翰有两台录像机,请计算他最多可以录制多少 ...

  9. shell脚本连接、读写、操作mysql数据库实例

    本文介绍了如何在shell中读写mysql数据库.主要介绍了如何在shell 中连接mysql数据库,如何在shell中创建数据库,创建表,插入csv文件,读取mysql数据库,导出mysql数据库为 ...

  10. win10下安装USB-Blaster哈希值错误

    插入usb-blaster后,无法安装驱动,一直显示感叹号,更新驱动后显示“文件的哈希值不在指定的目录”这样的错误提示,解决方法如下:1.Windows键+ R,输入shutdown.exe /r / ...