浅谈Thrift内部实现原理

http://dongxicheng.org/tag/thrift/

http://dongxicheng.org/search-engine/thrift-internals/

Thrift由两部分组成：编译器（在compiler目录下，采用C++编写）和服务器（在lib目录下），其中编译器的作用是将用户定义的thrift文件编译生成对应语言的代码，而服务器是事先已经实现好的、可供用户直接使用的RPC Server（当然，用户也很容易编写自己的server）。同大部分编译器一样，Thrift编译器（采用C++语言编写）也分为词法分析、语法分析等步骤，Thrift使用了开源的flex和Bison进行词法语法分析（具体见thrift.ll和thrift.yy），经过语法分析后，Thrift根据对应语言的模板（在compiler\cpp\src\generate目录下）生成相应的代码。对于服务器实现而言，Thrift仅包含比较经典的服务器模型，比如单线程模型（TSimpleServer），线程池模型（TThreadPoolServer）、一个请求一个线程（TThreadedServer）和非阻塞模型(TNonblockingServer)等。本文将以C++为例进行一个实例分析。

假设用户编写了以下Thrift文件：

 struct LogInfo {

 : required string name,

 : optional string content,

 }

 service LogSender {

 void SendLog(:list<LogInfo> loglist);

 }

用户使用命令“thrift –gen cpp example.thrift”可生成C++代码，该代码包含以下文件：

example_constants.h

example_constants.cpp

example_types.h  //struct定义

example_types.cpp  //struct实现

LogSender.h  //service定义

LogSender.cpp  //service实现和LogSenderClient实现

LogSender_server.skeleton.cpp //一个实例RPC Server

用户可以这样编写Client：

 shared_ptr socket(new TSocket(“8.8.8.8″, ));

 shared_ptr transport(new TBufferedTransport(socket));

 shared_ptr protocol(new TBinaryProtocol(transport));

 LogSenderClient client(protocol);

 try {

 transport->open();

 vector<LogInfo> logInfos;

 LogInfo logInfo(“image”, “:: visit:xxxxxx”);

 logInfos.push_back(logInfo);

 …..

 client.SendLog(logInfos);

 transport->close();

 } catch (TException &tx) {

 printf(“ERROR: %s\n”, tx.what());

 }

为了深入分析这段代码，我们看一下client.SendLog()函数的内部实现（在LogSender.cpp中）：

 void LogSenderClient::SendLog(const std::vector<LogInfo> & loglist)

 {

 send_SendLog(loglist);

 recv_SendLog();

 }

 void LogSenderClient::send_SendLog(const std::vector<LogInfo> & loglist)

 {

 int32_t cseqid = ;

 oprot_->writeMessageBegin(“SendLog”, ::apache::thrift::protocol::T_CALL, cseqid);

 LogSender_SendLog_pargs args;

 args.loglist = &loglist;

 args.write(oprot_);

 oprot_->writeMessageEnd();

 oprot_->getTransport()->flush();

 oprot_->getTransport()->writeEnd();

 }

 void LogSenderClient::recv_SendLog()

 {

 int32_t rseqid = ;

 std::string fname;

 ::apache::thrift::protocol::TMessageType mtype;

 iprot_->readMessageBegin(fname, mtype, rseqid);

 if (mtype == ::apache::thrift::protocol::T_EXCEPTION) {

 …..

 }

 if (mtype != ::apache::thrift::protocol::T_REPLY) {

 ……

 }

 if (fname.compare(“SendLog”) != ) {

 ……

 }

 LogSender_SendLog_presult result;

 result.read(iprot_);

 iprot_->readMessageEnd();

 iprot_->getTransport()->readEnd();

 return;

 }

阅读上面的代码，可以看出，RPC函数SendLog()实际上被转化成了两个函数：send_SendLog和recv_SendLog，分别用于发送数据和接收结果。数据是以消息的形式表示的，消息头部是RPC函数名，消息内容是RPC函数的参数。

我们再进一步分析RPC Server端，一个server的编写方法（在LogSender.cpp中）如下：

 shared_ptr protocolFactory(new TBinaryProtocolFactory());

 shared_ptr handler(new LogSenderHandler());

 shared_ptr processor(new LogSenderProcessor(handler));

 shared_ptr serverTransport(new TServerSocket());

 shared_ptr transportFactory(new TBufferedTransportFactory());

 TSimpleServer server(processor,

 serverTransport,

 transportFactory,

 protocolFactory);

 printf(“Starting the server…\n”);

 server.serve();

Server端最重要的类是LogSenderProcessor，它内部有一个映射关系processMap_，保存了所有RPC函数名到函数实现句柄的映射，对于LogSender而言，它只保存了一个RPC映射关系：

processMap_[" SendLog"] = &LogSenderProcessor::process_SendLog;

其中，process_SendLog是一个函数指针，它的实现如下：

 void LogSenderProcessor::process_SendLog(int32_t seqid, ::apache::thrift::protocol::TProtocol* iprot, ::apache::thrift::protocol::TProtocol* oprot)

 {

 LogSender_SendLog_args args;

 args.read(iprot);

 iprot->readMessageEnd();

 iprot->getTransport()->readEnd();

 LogSender_SendLog_result result;

 try {

 iface_->SendLog(args.loglist);//调用用户编写的函数

 } catch (const std::exception& e) {

 ……

 }

 oprot->writeMessageBegin(“SendLog”, ::apache::thrift::protocol::T_REPLY, seqid);

 result.write(oprot);

 oprot->writeMessageEnd();

 oprot->getTransport()->flush();

 oprot->getTransport()->writeEnd();

 }

LogSenderProcessor中一个最重要的函数是process()，它是服务器的主体函数，服务器端（socket server）监听到客户端有请求到达后，会检查消息类型，并检查processMap_映射，找到对应的消息处理函数，并调用之（注意，这个地方可以采用各种并发模型，比如one-request-one-thread，thread pool等）。

通过上面的分析可以看出，Thrift最重要的组件是编译器（采用C++编写），它为用户生成了网络通信相关的代码，从而大大减少了用户的编码工作。

浅谈Thrift内部实现原理的更多相关文章

TODO：浅谈pm2基本工作原理
TODO:浅谈pm2基本工作原理要谈Node.js pm2的工作原理,需要先来了解撒旦(Satan)和上帝(God)的关系. 撒旦(Satan),主要指<圣经>中的堕天使(也称堕天使撒旦 ...
浅谈SpringBoot核心注解原理
SpringBoot核心注解原理今天跟大家来探讨下SpringBoot的核心注解@SpringBootApplication以及run方法,理解下springBoot为什么不需要XML,达到零配置 ...
浅谈springboot自动配置原理
前言 springboot自动配置关键在于@SpringBootApplication注解,启动类之所以作为项目启动的入口,也是因为该注解,下面浅谈下这个注解的作用和实现原理 @SpringBootA ...
浅谈 underscore 内部方法 group 的设计原理
前言真是天一热什么事都不想干,这个月只产出了一篇文章,赶紧写一篇压压惊! 前文(https://github.com/hanzichi/underscore-analysis/issues/15)说 ...
浅谈 session 会话的原理
先谈 cookie 网络传输基于的Http协议,是无状态的协议,即每次连接断开后再去连接,服务器是无法判断此次连接的客户端是谁. 如果每次数据传输都需要进行连接和断开,那造成的开销是很巨大的. 为了解 ...
JAVA NIO之浅谈内存映射文件原理与DirectMemory
JAVA类库中的NIO包相对于IO 包来说有一个新功能是内存映射文件,日常编程中并不是经常用到,但是在处理大文件时是比较理想的提高效率的手段.本文我主要想结合操作系统中(OS)相关方面的知识介绍一下原 ...
【NIO】NIO之浅谈内存映射文件原理与DirectMemory
Java类库中的NIO包相对于IO 包来说有一个新功能是内存映射文件,日常编程中并不是经常用到,但是在处理大文件时是比较理想的提高效率的手段.本文我主要想结合操作系统中(OS)相关方面的知识介绍一下原 ...
浅谈JavaScript DDOS 攻击原理与防御
前言 DDoS(又名"分布式拒绝服务")攻击历史由来已久,但却被黑客广泛应用.我们可以这样定义典型的DDoS攻击:攻击者指使大量主机向服务器发送数据,直到超出处理能力进而无暇处理正 ...
浅谈HashMap 的底层原理
本文整理自漫画:什么是HashMap? -小灰的文章 .已获得作者授权. HashMap 是一个用于存储Key-Value 键值对的集合,每一个键值对也叫做Entry.这些个Entry 分散存储在一个 ...

随机推荐

[转]通俗易懂的php多线程解决方案
原文: https://www.w3cschool.cn/php/php-thread.html --------------------------------------------------- ...
基于Office 365 无代码工作流分析-表单基本需求分析！
3.2表单的制作基于下图的需求,我们须要定义例如以下的表单列表:
linux下查看网卡信息的命令
rhel 内核版本号信息: [root@hvrhub ~]# uname -a Linux hvrhub 2.6.18-308.el5 #1 SMP Fri Jan 27 17:17:51 EST 2 ...
一个能自己主动搜索源文件并自己主动推导的Makefile
今天看了一天的makefile的写法.东拼西凑.好不easy写出了一个makefile.颇有成就感,记录下来,以备温习之用. 如果有两个头文件文件夹 header1,header2;两个cpp文件文件 ...
【转载】lvs为何不能完全替代DNS轮询
上一篇文章"一分钟了解负载均衡的一切"引起了不少同学的关注,评论中大家争论的比较多的一个技术点是接入层负载均衡技术,部分同学持这样的观点: 1)nginx前端加入lvs和keepa ...
Python——list切片
前文简单介绍了Python中的list和它常用的一些函数,知道list是一个有序的数据集合,那么我们如何获取list中的元素呢? Index: 与C语言中数组一样,list可以通过每个元素的index ...
Linux input子系统实例分析（二）
紧接着上一节的实例我们来分析调用的input子系统的接口: 1. input_dev,用来标识输入设备 1: struct input_dev { 2: const char *name; //设备名 ...
adb4robotium跨进程框架抛出InputStream cannot be null的异常的解决方案
转自:http://blog.csdn.net/qingchunjun/article/details/43448371 之前我写的关于利用adb框架来进行robotium跨进程操作的文章中,有些朋友 ...
Python开发【深浅拷贝】
1.==与is a = [1,2] b = [1,2] a==b >>>True a is b >>>False 2.拷贝与非拷贝拷贝:原则上就是把数据分离出来, ...
1507: [NOI2003]Editor
1507: [NOI2003]Editor Time Limit: 5 Sec Memory Limit: 162 MB Submit: 3535 Solved: 1435 [Submit][St ...

浅谈Thrift内部实现原理

浅谈Thrift内部实现原理的更多相关文章

随机推荐

热门专题