thrift之TTransport层的堵塞的套接字I/O传输类TSocket
本节将介绍第一个实现具体传输功能的类TSocket,这个类是基于TCP socket实现TTransport的接口。下面具体介绍这个类的相关函数功能实现。
1.构造函数
分析一个类的功能首先看它的定义和构造函数实现,先看看它的定义:
class TSocket : public TVirtualTransport<TSocket> { ......}
由定义可以看书TSocket继承至虚拟传输类,并且把自己当做模板参数传递过去,所以从虚拟传输类继承下来的虚拟函数(如read_virt)调用非虚拟函数(如read)就是TSocket自己实现的。
TSocket类的构造函数有4个,当然还有一个析构函数。四个构造函数就是根据不同的参数来构造,它们的声明如下:
TSocket();//所有参数都默认
TSocket(std::string host, int port);//根据主机名和端口构造一个socket
TSocket(std::string path);//构造unix域的一个socket
TSocket(int socket);//构造一个原始的unix句柄socket
四个构造函数分别用于不同的情况下来产生不同的TSocket对象,不过这些构造函数都只是简单的初始化一些最基本的成员变量,而没有真正的连接socket。它们初始化的变量基本如下:
TSocket::TSocket() :
host_(""),
port_(),
path_(""),
socket_(-),
connTimeout_(),
sendTimeout_(),
recvTimeout_(),
lingerOn_(),
lingerVal_(),
noDelay_(),
maxRecvRetries_() {
recvTimeval_.tv_sec = (int)(recvTimeout_/);
recvTimeval_.tv_usec = (int)((recvTimeout_%)*);
cachedPeerAddr_.ipv4.sin_family = AF_UNSPEC;
}
大部分简单的参数都采用初始化列表初始化了,需要简单计算的就放在函数体内初始化,其他几个都是这种情况。下面需要单独介绍一下的是unix domain socket。
socket API原本是为网络通讯设计的,但后来在socket的框架上发展出一种IPC机制,就是UNIX Domain Socket。虽然网络socket也可用于同一台主机的进程间通讯(通过loopback地址127.0.0.1),但是UNIX Domain Socket用于IPC更有效率:不需要经过网络协议栈,不需要打包拆包、计算校验和、维护序号和应答等,只是将应用层数据从一个进程拷贝到另一个进程。这是因为,IPC机制本质上是可靠的通讯,而网络协议是为不可靠的通讯设计的。UNIX Domain Socket也提供面向流和面向数据包两种API接口,类似于TCP和UDP,但是面向消息的UNIX
Domain Socket也是可靠的,消息既不会丢失也不会顺序错乱。
UNIX Domain Socket是全双工的,API接口语义丰富,相比其它IPC机制有明显的优越性,目前已成为使用最广泛的IPC机制,比如X Window服务器和GUI程序之间就是通过UNIX Domain Socket通讯的。
使用UNIX Domain Socket的过程和网络socket十分相似,也要先调用socket()创建一个socket文件描述符,address family指定为AF_UNIX,type可以选择SOCK_DGRAM或SOCK_STREAM,protocol参数仍然指定为0即可。
UNIX Domain Socket与网络socket编程最明显的不同在于地址格式不同,用结构体sockaddr_un表示,网络编程的socket地址是IP地址加端口号,而UNIX Domain Socket的地址是一个socket类型的文件在文件系统中的路径,这个socket文件由bind()调用创建,如果调用bind()时该文件已存在,则bind()错误返回。
打开连接函数open
首先看这个函数的代码实现,如下:
void TSocket::open() {
if (isOpen()) {//如果已经打开就直接返回
return;
}
if (! path_.empty()) {//如果unix路径不为空就打开unix domian socket
unix_open();
} else {
local_open();//打开通用socket
}
}
Open函数又根据路径为不为空(不为空就是unix domain socket)调用相应的函数来继续打开连接,首先看看打开unix domain socket,代码如下:
void TSocket::unix_open(){
if (! path_.empty()) {//保证path_不为空
// Unix Domain SOcket does not need addrinfo struct, so we pass NULL
openConnection(NULL);//调用真正的打开连接函数
}
}
由代码可以看出,真正实现打开连接的函数是openConnection,这个函数根据传递的参数来决定是否是打开unix domain socket,实现代码如下(这个函数代码比较多,其中除了错误部分代码省略):
void TSocket::openConnection(struct addrinfo *res) {
if (isOpen()) {
return;//如果已经打开了直接返回
}
if (! path_.empty()) {//根据路径是否为空创建不同的socket
socket_ = socket(PF_UNIX, SOCK_STREAM, IPPROTO_IP);//创建unix domain socket
} else {
socket_ = socket(res->ai_family, res->ai_socktype, res->ai_protocol);//创建通用的网络通信socket
}
if (sendTimeout_ > ) {//如果发生超时设置大于0就调用设置发送超时函数设置发送超时
setSendTimeout(sendTimeout_);
}
if (recvTimeout_ > ) {//如果接收超时设置大于0就调用设置接收超时函数设置接收超时
setRecvTimeout(recvTimeout_);
}
setLinger(lingerOn_, lingerVal_);//设置优雅断开连接或关闭连接参数
setNoDelay(noDelay_);//设置无延时
#ifdef TCP_LOW_MIN_RTO
if (getUseLowMinRto()) {//设置是否使用较低的最低TCP重传超时
int one = ;
setsockopt(socket_, IPPROTO_TCP, TCP_LOW_MIN_RTO, &one, sizeof(one));
}
#endif
//如果超时已经存在设置连接为非阻塞
int flags = fcntl(socket_, F_GETFL, );//得到socket_的标识
if (connTimeout_ > ) {//超时已经存在
if (- == fcntl(socket_, F_SETFL, flags | O_NONBLOCK)) {//设置为非阻塞
}
} else {
if (- == fcntl(socket_, F_SETFL, flags & ~O_NONBLOCK)) {//设置为阻塞
}
}
// 连接socket
int ret;
if (! path_.empty()) {//unix domain socket
#ifndef _WIN32 //window不支持
struct sockaddr_un address;
socklen_t len;
if (path_.length() > sizeof(address.sun_path)) {//path_长度不能超过最长限制
}
address.sun_family = AF_UNIX;
snprintf(address.sun_path, sizeof(address.sun_path), "%s", path_.c_str());
len = sizeof(address);
ret = connect(socket_, (struct sockaddr *) &address, len);//连接unix domain socket
#else
//window不支持unix domain socket
#endif
} else {
ret = connect(socket_, res->ai_addr, res->ai_addrlen);//连接通用的非unix domain socket
}
if (ret == ) {//失败了就会执行后面的代码,用poll来监听写事件
goto done;//成功了就直接跳转到完成处
}
struct pollfd fds[];//定于用于poll的描述符
std::memset(fds, , sizeof(fds));//初始化为0
fds[].fd = socket_;//描述符为socket
fds[].events = POLLOUT;//接收写事件
ret = poll(fds, , connTimeout_);//调用poll,有一个超时值
if (ret > ) {
// 确保socket已经被连接并且没有错误被设置
int val;
socklen_t lon;
lon = sizeof(int);
int ret2 = getsockopt(socket_, SOL_SOCKET, SO_ERROR, cast_sockopt(&val), &lon);//得到错误选项参数
if (val == ) {// socket没有错误也直接到完成处了
goto done;
}
} else if (ret == ) {// socket 超时
//相应处理代码省略
} else {
// poll()出错了,相应处理代码省略
}
done:
fcntl(socket_, F_SETFL, flags);//设置socket到原来的模式了(阻塞)
if (path_.empty()) {//如果是unix domain socket就设置缓存地址
setCachedAddress(res->ai_addr, res->ai_addrlen);
}
}
上面这个函数代码确实比较长,不过还好都是比较简单的代码实现,没有什么很绕的代码,整个流程也很清晰,在代码中也有比较详细的注释了。下面继续看通用socket打开函数local_open(它也真正的执行打开功能也是调用上面刚才介绍的那个函数,只是传递了具体的地址信息):
void TSocket::local_open(){
#ifdef _WIN32
TWinsockSingleton::create();//兼容window平台
#endif // _WIN32
if (isOpen()) {//打开了就直接返回
return;
}
if (port_ < || port_ > 0xFFFF) {//验证端口是否为有效值
throw TTransportException(TTransportException::NOT_OPEN, "Specified port is invalid");
}
struct addrinfo hints, *res, *res0;
res = NULL;
res0 = NULL;
int error;
char port[sizeof("")];
std::memset(&hints, , sizeof(hints));//内存设置为0
hints.ai_family = PF_UNSPEC;
hints.ai_socktype = SOCK_STREAM;
hints.ai_flags = AI_PASSIVE | AI_ADDRCONFIG;
sprintf(port, "%d", port_);
error = getaddrinfo(host_.c_str(), port, &hints, &res0);//根据主机名得到所有网卡地址信息
// 循环遍历所有的网卡地址信息,直到有一个成功打开
for (res = res0; res; res = res->ai_next) {
try {
openConnection(res);//调用打开函数
break;//成功就退出循环
} catch (TTransportException& ttx) {
if (res->ai_next) {//异常处理,是否还有下一个地址,有就继续
close();
} else {
close();
freeaddrinfo(res0); // 清除地址信息内存和资源
throw;//抛出异常
}
}
}
freeaddrinfo(res0);//释放地址结构内存
}
整个local_open函数就是根据主机名得到所有的网卡信息,然后依次尝试打开,直到打开一个为止就退出循环,如果所有都不成功就抛出一个异常信息。
读函数read
在实现读函数的时候需要注意区分返回错误为EAGAIN的情况,因为当超时和系统资源耗尽都会产生这个错误(没有明显的特征可以区分它们),所以Thrift在实现的时候设置一个最大的尝试次数,如果超过这个了这个次数就认为是系统资源耗尽了。下面具体看看read函数的实现,代码如下(省略一些参数检查和错误处理的代码):
uint32_t TSocket::read(uint8_t* buf, uint32_t len) {
int32_t retries = ;//重试的次数
uint32_t eagainThresholdMicros = ;
if (recvTimeout_) {//如果设置了接收超时时间,那么计算最大时间间隔来判断是否系统资源耗尽
eagainThresholdMicros = (recvTimeout_*)/ ((maxRecvRetries_>) ? maxRecvRetries_ : );
}
try_again:
struct timeval begin;
if (recvTimeout_ > ) {
gettimeofday(&begin, NULL);//得到开始时间
} else {
begin.tv_sec = begin.tv_usec = ;//默认为0,不需要时间来判断是超时了
}
int got = recv(socket_, cast_sockopt(buf), len, );//从socket接收数据
int errno_copy = errno; //保存错误代码
++g_socket_syscalls;//系统调用次数统计加1
if (got < ) {//如果读取错误
if (errno_copy == EAGAIN) {//是否为EAGAIN
if (recvTimeout_ == ) {//如果没有设置超时时间,那么就是资源耗尽错误了!抛出异常
throw TTransportException(TTransportException::TIMED_OUT, "EAGAIN (unavailable resources)");
}
struct timeval end;
gettimeofday(&end, NULL);//得到结束时间,会改变errno,所以前面需要保存就是这个原因
uint32_t readElapsedMicros = (((end.tv_sec - begin.tv_sec) * * )//计算消耗的时间
+ (((uint64_t)(end.tv_usec - begin.tv_usec))));
if (!eagainThresholdMicros || (readElapsedMicros < eagainThresholdMicros)) {
if (retries++ < maxRecvRetries_) {//重试次数还小于最大重试次数
usleep();//睡眠50毫秒
goto try_again;//再次尝试从socket读取数据
} else {//否则就认为是资源不足了
throw TTransportException(TTransportException::TIMED_OUT, "EAGAIN (unavailable resources)");
}
} else {//推测为超时了
throw TTransportException(TTransportException::TIMED_OUT, "EAGAIN (timed out)");
}
}
if (errno_copy == EINTR && retries++ < maxRecvRetries_) {//如果是中断并且重试次数没有超过
goto try_again;//那么重试
}
#if defined __FreeBSD__ || defined __MACH__
if (errno_copy == ECONNRESET) {//FreeBSD和MACH特殊处理错误代码
return ;
}
#endif
#ifdef _WIN32
if(errno_copy == WSAECONNRESET) {//win32平台处理错误代码
return ; // EOF
}
#endif
return got;
}
整个读函数其实没有什么特别的,主要的任务就是错误情况的处理,从这里可以看出其实实现一个功能是很容易的,但是要做到稳定和容错性确实需要发很大功夫。
写函数write
写函数和读函数实现差不多,主要的代码还是在处理错误上面,还有一点不同的是写函数写的内容可能一次没有发送完毕,所以是在一个while循环中一直发送直到指定的内容全部发送完毕。代码实现如下:
void TSocket::write(const uint8_t* buf, uint32_t len) {
uint32_t sent = ;//记录已经发送了的字节数
while (sent < len) {//是否已经发送了指定的字节长度
uint32_t b = write_partial(buf + sent, len - sent);//调部分写入函数
if (b == ) {//发送超时过期了
throw TTransportException(TTransportException::TIMED_OUT, "send timeout expired");
}
sent += b;//已经发送的字节数
}
}
上面的函数还没有这种的调用send函数发送写入的内容,而是调用部分写入函数write_partial写入,这个函数实现如下:
uint32_t TSocket::write_partial(const uint8_t* buf, uint32_t len) {
uint32_t sent = ;
int flags = ;
#ifdef MSG_NOSIGNAL
//使用这个代替SIGPIPE 错误,代替我们检查返回EPIPE错误条件和关闭socket的情况
flags |= MSG_NOSIGNAL;//设置这个标志位
#endif
int b = send(socket_, const_cast_sockopt(buf + sent), len - sent, flags);//发送数据
++g_socket_syscalls;//系统调用计数加1
if (b < ) { //错误处理
if (errno == EWOULDBLOCK || errno == EAGAIN) {
return ;//应该阻塞错误直接返回
}
int errno_copy = errno;//保存错误代码
if (errno_copy == EPIPE || errno_copy == ECONNRESET || errno_copy == ENOTCONN) {
close();//连接错误关闭掉socket
}
}
return b;//返回写入的字节数
}
这个写入的实现逻辑和过程也是非常简单的,只是需要考虑到各种错误的情况并且相应的处理之。
其他函数
TSocket类还有一些其他函数,不过功能都比较简单,比如设置一些超时和得到一些成员变量值的函数,哪些函数一般都是几句代码完成了。
thrift之TTransport层的堵塞的套接字I/O传输类TSocket的更多相关文章
- thrift之TTransport层的分帧传输类TFramedTransport
帧传输类就是按照一帧的固定大小来传输数据,所有的写操作首先都是在内存中完成的直到调用了flush操作,然后传输节点在flush操作之后将所有数据根据数据的有效载荷写入数据的长度的二进制块发送出去,允许 ...
- thrift之TTransport层的缓存传输类TBufferedTransport和缓冲基类TBufferBase
本节主要介绍缓冲相关的传输类,缓存的作用就是为了提高读写的效率.Thrift在实现缓存传输的时候首先建立一个缓存的基类,然后需要实现缓存功能的类都可以直接从这个基类继承.下面就详细分析这个基类以及一个 ...
- Day09: socket网络编程-OSI七层协议,tcp/udp套接字,tcp粘包问题,socketserver
今日内容:socket网络编程 1.OSI七层协议 2.基于tcp协议的套接字通信 3.模拟ssh远程执行命令 4.tcp的粘包问题及解决方案 5.基于udp协议的套接字 ...
- linux网络编程-(socket套接字编程UDP传输)
今天我们来介绍一下在linux网络环境下使用socket套接字实现两个进程下文件的上传,下载,和退出操作! 在socket套接字编程中,我们当然可以基于TCP的传输协议来进行传输,但是在文件的传输中, ...
- socket套接字TCP协议传输-案例测试
术语: 套接字接口:socket,是一个IP地址和一个端口号的组合,套接字可以唯一标识整个Internet中的一个网络进程. TCP连接:一对套接字接口(一个用于接收,一个用于发送)可定义面向连接的协 ...
- thrift之TTransport层的内存缓存传输类TMemoryBuffer
内存缓存是简单的在内存进行读写操作的一种传输,任何时候想在上面写入数据都是放入缓存中,任何时候读操作数据也是来至于缓存.内存缓存的分配使用c语言的malloc类函数,分配的长度是需要长度的两倍,需要考 ...
- python基础--基于套接字进行文件传输、异常处理、socketserver模块
异常处理: 什么是异常处理: 程序在运行过程中出现了不可预知的错误,并且该错误没有对应的处理机制,那么就会以异常的形式表现出来,造成的影响就是整个程序无法再正常运行 异常的结构: 异常的类型.异常的信 ...
- 移动IP 它最初设想每个人都在编写应用层(7)API而不是传输层(4)API 对于QUIC,连接的标识符不是“套接字”(源/目标端口/地址协议组合)的传统概念,而是分配给连接的64位标识符
小结: 1. 因为您对OSI模型的教育中缺少的一点是,它最初设想每个人都在编写应用层(7)API而不是传输层(4)API.应该有像应用程序服务元素之类的 东西,它们可以以标准方式处理文件传输和消息传递 ...
- Linux编程---套接字
网络相关的东西差点儿都是建立在套接字之上.所以这个内容对于程序猿来说还是蛮重要的啊. 事实上套接字也就是一个特殊的设备文件而已,我始终不能明确为什么要叫套接字.这么个奇怪的名字.只是还是就这样算了吧. ...
随机推荐
- 为什么V8引擎这么快?
目录(?)[-] 高速引擎的需求 语言本身的问题 JIT编译 JIT Compile 垃圾回收管理 内嵌缓存inline cache 隐藏类 内嵌缓存Inline Cache 机器语言的特性 附录熟悉 ...
- 7.Mybatis关联表查询(这里主要讲的是一对一和一对多的关联查询)
在Mybatis中的管理表查询这里主要介绍的是一对一和一对多的关联查询的resultMap的管理配置查询,当然你也可以用包装类来实现.不过这里不说,做关联查询的步骤可以简单的总结为以下的几步: 1.分 ...
- 将CSDN和WordPress上的旧文章迁移过来
我最早用的博客是CSDN,但是不喜欢CSDN的博客,发文章还要审核,界面做的也很模糊,发个文章还必须选个分类.总之不像是用心在做博客这个功能. 后来,我自己搭建了一个网站(www.wangyufeng ...
- 使用soureTree删除分支
使用心得 1:使用pull拉取时,自己本地的更改不会覆盖掉 2:删除分枝时,直接选中,可以直接删除远程的分枝
- solr入门命令
#####################shell命令############################# 导入文档: sh bin/post -c gettingstarted docs/i ...
- 使用 python 操作 redis
1.安装pyredis (1)使用 # easy_install redis (2)直接编译安装 #wget https://pypi.python.org/packages/source/r/red ...
- Windows平台使用Gitblit搭建Git服务器图文教程
Git服务现在独树一帜,相比与SVN有更多的灵活性,最流行的开源项目托管网站Github上面,如果托管开源项目,那么就是免费使用的,但是闭源的项目就会收取昂贵的费用,如果你不缺米,那么不在本文讨论的范 ...
- canvas像素操作
像素操作 相关方法:getImageData(x,y,w,h); putImageData(oImg,x,y); createImageData(w,h); 1.getImageData(x,y, ...
- IOS单例模式要做到3点
1,永远只分配一块内存来创建对象. +(instanst) static id instace = nil; static dispatch_once_t onceToken; dispatch_on ...
- [学习笔记] 七步从AngularJS菜鸟到专家(6):服务 [转]
这是"AngularJS – 七步从菜鸟到专家"系列的第六篇. 在第一篇,我们展示了如何开始搭建一个AngularaJS应用.在第五篇我们讨论了Angular内建的directives.在这一章,我们 ...