分布式缓存系统 Memcached 主线程之main函数

前两节中对工作线程的工作流程做了较为详细的分析，现把其主要流程总结为下图：

接下来本节主要分析主线程相关的函数设计，主函数main的基本流程如下图所示：

对于主线程中的工作线程的初始化到启动所有的工作线程前面已经做了分析，后面的创建监听socket、注册监听socket的libevent事件、启动主线程的libevent事件循环，就是接下来的内容了。

其中主要调用的函数是server_sockets，该函数从配置参数setting.inner字符串中依次提取出一个ip或者一个hostname(一个hostname可能有多个ip)，然后传给函数server_socket函数处理之。server_socket函数负责完成创建socket,绑定到端口，监听socket,并将该监听socket对应的conn结构(调用函数conn_new，在该函数中将监听socket注册到主线程libevent main_base上，回调函数为event_handler，其核心部分是drive_machine，这与工作线程是一致的)，然后将该conn放入监听队列（ conn *listen_conn）中。监听socket上接收到的客户连接的conn将放到连接队列conn **conns中。最后在main函数中启动libevent事件循环。还是图来的直观，如下：

static int server_sockets(int port, enum network_transport transport,
FILE *portnumber_file) { //<span style="color: rgb(0, 130, 0); font-family: Consolas, 'Courier New', Courier, mono, serif; font-size: 11.8518514633179px; line-height: 18px;">port是默认的11211或者用户使用-p选项设置的端口号</span>

//settings.inter里面可能有多个IP地址.如果有多个那么将用逗号分隔
char *b;
int ret = 0;
//复制一个字符串，避免下面的strtok_r函数修改(污染)全局变量settings.inter
char *list = strdup(settings.inter);

//这个循环主要是处理多个IP的情况
for (char *p = strtok_r(list, ";,", &b);
p != NULL; //分割出一个个的ip,使用分号;作为分隔符
p = strtok_r(NULL, ";,", &b)) {
int the_port = port;
char *s = strchr(p, ':');//启动的可能使用-l ip:port 参数形式
//ip后面接着端口号，即指定ip的同时也指定了该ip的端口号
//此时采用ip后面的端口号，而不是采用-p指定的端口号
if (s != NULL) {
*s = '\0';//截断后面的端口号，使得p指向的字符串只是一个ip
++s;
if (!safe_strtol(s, &the_port)) {//非法端口号参数值
return 1;
}
}
if (strcmp(p, "*") == 0) {
p = NULL;
}
//处理其中一个IP。有p指定ip(或者hostname)
ret |= server_socket(p, the_port, transport, portnumber_file);
}
free(list);
return ret;
}


static conn *listen_conn = NULL;//监听队列(可能要同时监听多个IP)

//interface是一个ip、hostname或者NULL。这个ip字符串后面没有端口号。端口号由参数port指出
static int server_socket(const char *interface,
int port,
enum network_transport transport,
FILE *portnumber_file) {
int sfd;
struct linger ling = {0, 0};
struct addrinfo *ai;
struct addrinfo *next;
struct addrinfo hints = { .ai_flags = AI_PASSIVE,
.ai_family = AF_UNSPEC };
char port_buf[NI_MAXSERV];
int success = 0;
int flags =1;

hints.ai_socktype = IS_UDP(transport) ? SOCK_DGRAM : SOCK_STREAM;


snprintf(port_buf, sizeof(port_buf), "%d", port);
getaddrinfo(interface, port_buf, &hints, &ai);

//如果interface是一个hostname的话，那么可能就有多个ip
for (next= ai; next; next= next->ai_next) {
conn *listen_conn_add;

//创建一个套接字，然后设置为非阻塞的
sfd = new_socket(next);//调用socket函数
bind(sfd, next->ai_addr, next->ai_addrlen);

success++;
listen(sfd, settings.backlog);

//函数conn_new中将监听套接字fd注册到main_base上，并设定回调函数为event_handler，其中核心为drive_machine函数，这与工作线程是一致的
if (!(listen_conn_add = conn_new(sfd, conn_listening,
EV_READ | EV_PERSIST, 1,
transport, main_base))) {
fprintf(stderr, "failed to create listening connection\n");
exit(EXIT_FAILURE);
}

//将要监听的多个conn放到一个监听队列里面
listen_conn_add->next = listen_conn;
listen_conn = listen_conn_add;

}

freeaddrinfo(ai);

/* Return zero iff we detected no errors in starting up connections */
return success == 0;
}


static int new_socket(struct addrinfo *ai) {
int sfd;
int flags;
sfd = socket(ai->ai_family, ai->ai_socktype, ai->ai_protocol);
flags = fcntl(sfd, F_GETFL, 0);
fcntl(sfd, F_SETFL, flags | O_NONBLOCK);

return sfd;
}

主线程为每一个监听socket 和接收到的每一个客户端连接socket都分配一个conn结构体，用于管理该socket的各种状态信息等。需要注意的是的，memcached并不是对每一个socket分别创建分配一个conn结构，而是在初始化时一次性分配若干（跟审定的允许的同时最大数量的客户端连接数有关）个conn结构的指针（注意不是conn结构体，因为每一个conn结构是比较大的，因此如果直接分配若干个conn结构需要占用较大空间），在都确实需要一个conn结构时，再从预分配的指针数组中取用一个，并实际为该指针分配空间，完成具体的初始化等。这与前面的CQ_ITEM内存池是一致的——按配置预分配若干，按需取用，循环利用。避免内存碎片，提高性能。

其中函数conn_init负责预分配设置的若干个conn的指针，由一个conn**指针维护。函数conn_new则在确实需要一个conn时从conn**维护的数组中取得一个conn*,并完成实际的空间分配等。

具体分析如下：

函数conn_init:

conn **conns; //conn数组指针
static void conn_init(void) {
/* We're unlikely to see an FD much higher than maxconns. */
//已经dup返回当前未使用的最小正整数，所以next_fd等于此刻已经消耗了的fd个数
int next_fd = dup(1);//获取当前已经使用的fd的个数
//预留一些文件描述符。也就是多申请一些conn结构体。以免有别的需要把文件描述符
//给占了。导致socket fd的值大于这个数组长度
int headroom = 10;//预留一些文件描述符 /* account for extra unexpected open FDs */
struct rlimit rl;

//settings.maxconns的默认值是1024.
max_fds = settings.maxconns + headroom + next_fd;

/* But if possible, get the actual highest FD we can possibly ever see. */
if (getrlimit(RLIMIT_NOFILE, &rl) == 0) {
max_fds = rl.rlim_max;
} else {
fprintf(stderr, "Failed to query maximum file descriptor; "
"falling back to maxconns\n");
}

close(next_fd);//next_fd只是用来计数的，并没有其他用途

//注意，申请的conn结构体数量是比settings.maxconns这个客户端同时在线数
//还要大的。因为memcached是直接用socket fd的值作为数组下标的。也正是
//这个��因，前面需要使用headroom预留一些空间给突发情况
if ((conns = calloc(max_fds, sizeof(conn *))) == NULL) {//注意是conn指针不是conn结构体
fprintf(stderr, "Failed to allocate connection structures\n");
/* This is unrecoverable so bail out early. */
exit(1);
}
}

函数conn_new:

//为sfd分配一个conn结构体，并且为这个sfd建立一个event，然后注册到event_base上。
conn *conn_new(const int sfd, enum conn_states init_state,//init_state值为conn_listening
const int event_flags,
const int read_buffer_size, enum network_transport transport,
struct event_base *base) {
conn *c;

assert(sfd >= 0 && sfd < max_fds);
c = conns[sfd];//直接使用下标

if (NULL == c) {//之前没有哪个连接用过这个sfd值，需要申请一个conn结构体
if (!(c = (conn *)calloc(1, sizeof(conn)))) {
fprintf(stderr, "Failed to allocate connection object\n");
return NULL;
}

...//初始化一些成员变量

c->sfd = sfd;
conns[sfd] = c; //将这个结构体交由conns数组管理
}

...//初始化另外一些成员变量
c->state = init_state;//值为conn_listening

//等同于event_assign，会自动关联current_base。event的回调函数是event_handler
event_set(&c->event, sfd, event_flags, event_handler, (void *)c);
event_base_set(base, &c->event);
c->ev_flags = event_flags;

if (event_add(&c->event, 0) == -1) {
perror("event_add");
return NULL;
}

return c;
}

从上可以看到，实际上所有的conn从预分配到实际分配，都是有conn**指针维护的。只需要通过判断该数组中的某元素conn指针是否为空：等于NULL即没被实际占用，处于空闲状态，反之，已经被一个实际的socket fd占用。

至此，主线程所有的准备工作已经就绪，接下来就是真正的客户端连接事件的处理了：

回调函数event_handler（工作线程的注册事件的回调函数也是它）：

event_handler本身是简单的，其核心是drive_machine函数（一个有限状态机，负责处理所有的客户逻辑）。

void event_handler(const int fd, const short which, void *arg) {
conn *c;

c = (conn *)arg;
assert(c != NULL);

c->which = which;
if (fd != c->sfd) {
conn_close(c);
return;
}

drive_machine(c);
return;
}

其中的drive_machine还是比较复杂的，接下来将分几个小节的内容，对此细细道来。

分布式缓存系统 Memcached 主线程之main函数的更多相关文章

分布式缓存系统 Memcached 整体架构
分布式缓存系统 Memcached整体架构 Memcached经验分享[架构方向] Memcached 及 Redis 架构分析和比较
分布式缓存系统 Memcached 工作线程初始化
Memcached采用典型的Master-Worker模式,其核心思想是:有Master和Worker两类进程(线程)协同工作,Master进程负责接收和分配任务,Worker进程负责处理子任务.当各 ...
分布式缓存系统Memcached简介与实践
缘起: 在数据驱动的web开发中,经常要重复从数据库中取出相同的数据,这种重复极大的增加了数据库负载.缓存是解决这个问题的好办法.但是ASP.NET中的虽然已经可以实现对页面局部进行缓存,但还是不够灵 ...
分布式缓存系统Memcached简介与实践(.NET memcached client library)
缘起: 在数据驱动的web开发中,经常要重复从数据库中取出相同的数据,这种重复极大的增加了数据库负载.缓存是解决这个问题的好办法.但是ASP.NET中的虽然已经可以实现对页面局部进行缓存,但还是不够灵 ...
（转）C# 中使用分布式缓存系统Memcached
转自:http://blog.csdn.net/devgis/article/details/8212917 缘起: 在数据驱动的web开发中,经常要重复从数据库中取出相同的数据,这种重复极大的增加了 ...
分布式缓存系统Memcached简介与以及在.net下的实践(转)
缘起: 在数据驱动的web开发中,经常要重复从数据库中取出相同的数据,这种重复极大的增加了数据库负载.缓存是解决这个问题的好办法.但是ASP.NET中的虽然已经可以实现对页面局部进行缓存,但还是不够灵 ...
[Memcached]分布式缓存系统Memcached在Asp.net下的应用
Memcached 是一个高性能的分布式内存对象缓存系统,用于动态Web应用以减轻数据库负载.它通过在内存中缓存数据和对象来减少读取数据库的次数,从而提高动态.数据库驱动网站的速度.Memcached ...
分布式缓存系统Memcached在Asp.net下的应用
Memcached 是一个高性能的分布式内存对象缓存系统.用于动态Web应用以减轻数据库负载.它通过在内存中缓存数据和对象来降低读取数据库的次数,从而提高动态.数据库驱动站点的速度. Memcache ...
php分布式缓存系统 Memcached 入门
Memcached 是一个分布式的缓存系统, 但是 Memcachd 到底是什么意思,有什么作用呢?缓存一般用来保存一些经常被存取的数据和资源(例如:浏览器会将访问过的网页会话缓存起来),因为通过缓存 ...

随机推荐

dpdk对虚拟化的支持调研
目录: 虚拟化 dpdk的实现研究 virtio vhost SR-IOV 热迁移相关研究拓展本文记录近期对dpdk在虚拟化和云计算领域应用的研究成果,内容梳理如下. 虚拟化虚拟化,抽象来说,就 ...
bitmap==null
bitmap==null 一.问题介绍调试找bug的过程出现bitmap==null,而传过来创建bitmap的byte array有数据, 结果看了函数说明: 果断知道是那个图片没有办法decod ...
Selenium with Python 001 - 安装篇
Selenium Python bindings 提供了一个简单的API,让你使用Selenium WebDriver来编写功能/校验测试. 通过Selenium Python的API,你可以非常直观 ...
遍历jsonArray和jsonObject
遍历jsonArray String str = "[{name:'a',value:'aa'},{name:'b',value:'bb'},{name:'c',value:'cc'}]&q ...
[转载]Java给word中的table赋值
一.准备工作: 下载PageOffice for Java:http://www.zhuozhengsoft.com/dowm/ 二. 实现方法: 要调用PageOffice操作Word中的tabl ...
HTML 中 id与name 区别
一个name可以同时对应多个控件,比如checkbox和radio而id必须是全文档中唯一的 id的用途1) id是HTML元素的Identity,主要是在客户端脚本里用.2) label与form控 ...
[eShopOnContainers 学习系列] - 02 - vs 2017 开发环境配置
[eShopOnContainers 学习系列] - 02 - vs 2017 开发环境配置 https://github.com/dotnet-architecture/eShopOnContain ...
SWF文件加密、混淆
简单说下SWF文件的混淆原理,(已经明白的请跳过本段):我们的AS源代码被编译完成后,SWF内部会形成一个字符串映射表,包含源码里出现的所有字符串(类名,包名,成员变量名,常量等).一个数字(相当于地 ...
Android快速开发-选项卡
介绍几行代码实现Android选项卡界面,支持标准底部Tab自定义视图选项卡,头部文字选项卡. 底部自定义视图选项卡先来看看实现下图中的效果我们代码应该怎么写? 实现上图效果只需以下代码: pub ...
ng 双向数据绑定实现注册协议效果
效果: 代码: <!DOCTYPE html> <html ng-app="myApp"> <head lang="en"> ...

分布式缓存系统 Memcached 主线程之main函数

分布式缓存系统 Memcached 主线程之main函数的更多相关文章

随机推荐

热门专题