ngx_hash源码解析

ngx_hash是nginx中的hash表结构，具有以下特点：

静态结构，hash表创建后无法动态添加/删除KV。
采用连续存储方式解决碰撞问题。即出现碰撞的KV存放在连续地址。
支持前缀和后缀通配符匹配。

以上特点决定了其高效性与功能局限性。

内存结构&hash_find

根据结构体定义与ngx_hash_find函数可以看出其内存存放结构

typedef struct {

    void             *value;

    u_short           len;

    u_char            name[1];

} ngx_hash_elt_t;

typedef struct {

    //hash表分多个桶，每个桶内存放hash(key)碰撞的元素

    ngx_hash_elt_t  **buckets;

    ngx_uint_t        size;

} ngx_hash_t;

void *

ngx_hash_find(ngx_hash_t *hash, ngx_uint_t key, u_char *name, size_t len)

{

    ngx_uint_t       i;

    ngx_hash_elt_t  *elt;

    //key % hash->size 选择桶

    elt = hash->buckets[key % hash->size];

    if (elt == NULL) {

        return NULL;

    }

    while (elt->value) {

        if (len != (size_t) elt->len) {

            goto next;

        }

        //比对key

        for (i = 0; i < len; i++) {

            if (name[i] != elt->name[i]) {

                goto next;

            }

        }

        return elt->value;

    next:

        //计算下一个ele地址，每个ele长度不固定。

        elt = (ngx_hash_elt_t *) ngx_align_ptr(&elt->name[0] + elt->len, sizeof(void *));

        continue;

    }

    return NULL;

}

示意图如下：

整个hash表结构分成若干个bucket，每个bucket内存放key值碰撞的元素。

每个bucket的大小是初始化时指定的一个值(bucket_size)，要求大于最大元素的大小。即bucket_size约束了元素的大小。但实际的桶大小还要根据各种信息具体确定，详见下文初始化部分。
bucket的数量时初始化时根据各种信息计算得到，详见下文初始化部分。

每个元素内保存了完整的key值，注意ngx_hash_elt_t.name实际存储的内容包括完成的key，不仅是1个字节，len表示其真实长度。所以每个元素的大小是不一致的，根据key的实际长度决定。

hash表结构初始化

初始化使用的是ngx_int_t ngx_hash_init(ngx_hash_init_t *hinit, ngx_hash_key_t *names, ngx_uint_t nelts)函数。

ngx_hash_init_t *hinit结构如下：

typedef struct {

    ngx_hash_t       *hash; //出参，初始化好的hash表，后续通过ngx_hash_find()函数使用

    ngx_hash_key_pt   key;  //hash计算函数，常用选项有ngx_hash_key和ngx_hash_key_lc

    ngx_uint_t        max_size; //最大桶数量，实际数量在函数中计算。

    ngx_uint_t        bucket_size; //每个桶的大小。

    char             *name; //表名词

    ngx_pool_t       *pool; //数据pool

    ngx_pool_t       *temp_pool; //临时pool，仅在需要通配符的hash表初始化是使用，ngx_hash_init()不需要使用

} ngx_hash_init_t;

ngx_hash_key_t *names和ngx_uint_t nelts组成一组key不重复的KV集合。nginx提供了另外一组函数ngx_hash_keys_array_init()和ngx_hash_add_key()用于创造不重复的KV集合列表。

typedef struct {

    ngx_str_t         key;

    ngx_uint_t        key_hash;

    void             *value;

} ngx_hash_key_t;

ngx_hash_init()逻辑如下

//计算元素大小，元素结构参考ngx_hash_elt_t

#define NGX_HASH_ELT_SIZE(name)                                               \

    (sizeof(void *) + ngx_align((name)->key.len + 2, sizeof(void *)))

ngx_int_t

ngx_hash_init(ngx_hash_init_t *hinit, ngx_hash_key_t *names, ngx_uint_t nelts)

{

    u_char          *elts;

    size_t           len;

    u_short         *test;

    ngx_uint_t       i, n, key, size, start, bucket_size;

    ngx_hash_elt_t  *elt, **buckets;

    //入参判断

    if (hinit->max_size == 0) {

        ngx_log_error(NGX_LOG_EMERG, hinit->pool->log, 0,

                      "could not build %s, you should "

                      "increase %s_max_size: %i",

                      hinit->name, hinit->name, hinit->max_size);

        return NGX_ERROR;

    }

    //元素的大小都小于桶大小，保证1个桶能存放至少任意1个元素。

    for (n = 0; n < nelts; n++) {

        if (hinit->bucket_size < NGX_HASH_ELT_SIZE(&names[n]) + sizeof(void *))

        {

            ngx_log_error(NGX_LOG_EMERG, hinit->pool->log, 0,

                          "could not build %s, you should "

                          "increase %s_bucket_size: %i",

                          hinit->name, hinit->name, hinit->bucket_size);

            return NGX_ERROR;

        }

    }

	//test用于计算每个桶所需要的大小，即hash(key)碰撞的几个元素大小之和

    test = ngx_alloc(hinit->max_size * sizeof(u_short), hinit->pool->log);

    if (test == NULL) {

        return NGX_ERROR;

    }

	//计算一个初始的桶数量，算法含义没理解。

    bucket_size = hinit->bucket_size - sizeof(void *);

    start = nelts / (bucket_size / (2 * sizeof(void *)));

    start = start ? start : 1;

    if (hinit->max_size > 10000 && nelts && hinit->max_size / nelts < 100) {

        start = hinit->max_size - 1000;

    }

	//逐步调整，找到一个能放下所有元素的桶数量。

    for (size = start; size <= hinit->max_size; size++) {

        ngx_memzero(test, size * sizeof(u_short));

        for (n = 0; n < nelts; n++) {

            if (names[n].key.data == NULL) {

                continue;

            }

            key = names[n].key_hash % size;

            test[key] = (u_short) (test[key] + NGX_HASH_ELT_SIZE(&names[n]));

            //test[key] > bucket_size 表示hash(key)相同的元素总大小 > 桶大小

            //则调整桶数量(size++)，减少碰撞，减少hash(key)相同的元素总大小

            if (test[key] > (u_short) bucket_size) {

                goto next;

            }

        }

        goto found;

    next:

        continue;

    }

    size = hinit->max_size;

    ngx_log_error(NGX_LOG_WARN, hinit->pool->log, 0,

                  "could not build optimal %s, you should increase "

                  "either %s_max_size: %i or %s_bucket_size: %i; "

                  "ignoring %s_bucket_size",

                  hinit->name, hinit->name, hinit->max_size,

                  hinit->name, hinit->bucket_size, hinit->name);

found:

	//重新赋值test[]，如果是goto found，和之前的test[]是一样的。

    //test[i]表示第i个桶的大小

    for (i = 0; i < size; i++) {

        test[i] = sizeof(void *);

    }

    for (n = 0; n < nelts; n++) {

        if (names[n].key.data == NULL) {

            continue;

        }

        key = names[n].key_hash % size;

        test[key] = (u_short) (test[key] + NGX_HASH_ELT_SIZE(&names[n]));

    }

	//计算表的大小，且保证每个桶起始地址可以是cacheline对齐

    len = 0;

    for (i = 0; i < size; i++) {

        if (test[i] == sizeof(void *)) {

            continue;

        }

        test[i] = (u_short) (ngx_align(test[i], ngx_cacheline_size));

        len += test[i];

    }

    //申请hinit->hash和hinit->hash->buckets基本结构空间

    if (hinit->hash == NULL) {

        hinit->hash = ngx_pcalloc(hinit->pool, sizeof(ngx_hash_wildcard_t)

                                             + size * sizeof(ngx_hash_elt_t *));

        if (hinit->hash == NULL) {

            ngx_free(test);

            return NGX_ERROR;

        }

        buckets = (ngx_hash_elt_t **)((u_char *) hinit->hash + sizeof(ngx_hash_wildcard_t));

    } else {

        buckets = ngx_pcalloc(hinit->pool, size * sizeof(ngx_hash_elt_t *));

        if (buckets == NULL) {

            ngx_free(test);

            return NGX_ERROR;

        }

    }

	//分配元素空间，且保证元素起始地址是cacheline对齐的

    elts = ngx_palloc(hinit->pool, len + ngx_cacheline_size);

    if (elts == NULL) {

        ngx_free(test);

        return NGX_ERROR;

    }

    elts = ngx_align_ptr(elts, ngx_cacheline_size);

	//buckets[]与元素空间关联

    for (i = 0; i < size; i++) {

        if (test[i] == sizeof(void *)) {

            continue;

        }

        buckets[i] = (ngx_hash_elt_t *) elts;

        elts += test[i];

    }

    for (i = 0; i < size; i++) {

        test[i] = 0;

    }

	//将names[]的KV列表复制到hash表结构中

    for (n = 0; n < nelts; n++) {

        if (names[n].key.data == NULL) {

            continue;

        }

        key = names[n].key_hash % size;

        elt = (ngx_hash_elt_t *) ((u_char *) buckets[key] + test[key]);

        elt->value = names[n].value;

        elt->len = (u_short) names[n].key.len;

        ngx_strlow(elt->name, names[n].key.data, names[n].key.len);

        test[key] = (u_short) (test[key] + NGX_HASH_ELT_SIZE(&names[n]));

    }

	//配置每个桶内最后一个ele->value = NULL;

    for (i = 0; i < size; i++) {

        if (buckets[i] == NULL) {

            continue;

        }

        elt = (ngx_hash_elt_t *) ((u_char *) buckets[i] + test[i]);

        elt->value = NULL;

    }

    ngx_free(test);

    hinit->hash->buckets = buckets;

    hinit->hash->size = size;

    return NGX_OK;

}

辅助初始化

在使用ngx_int_t ngx_hash_init(ngx_hash_init_t *hinit, ngx_hash_key_t *names, ngx_uint_t nelts)时要求names[]时一个key内容不重复列表。构造内容不重复的列表如果每次采用循环判断当列表巨大时，时间开销较大，nginx提供2个辅助函数ngx_int_t ngx_hash_keys_array_init(ngx_hash_keys_arrays_t *ha, ngx_uint_t type)和ngx_int_t ngx_hash_add_key(ngx_hash_keys_arrays_t *ha, ngx_str_t *key, void *value, ngx_uint_t flags)通过一个简易的链状hash进行重复检查。代码中部分涉及通配符处理的先略过下文再说。

typedef struct {

    ngx_uint_t        hsize; //简易hash表的桶数量

    ngx_pool_t       *pool;

    ngx_pool_t       *temp_pool;

    ngx_array_t       keys;         //精确匹配的key列表

    ngx_array_t      *keys_hash;    //使用二维数组构造的简易hash表，用于检查key是否重复。

    ...

} ngx_hash_keys_arrays_t;

ngx_int_t

ngx_hash_keys_array_init(ngx_hash_keys_arrays_t *ha, ngx_uint_t type)

{

    ...

    if (ngx_array_init(&ha->keys, ha->temp_pool, asize, sizeof(ngx_hash_key_t))

        != NGX_OK) {

        return NGX_ERROR;

    }

    if (ngx_array_init(&ha->dns_wc_head, ha->temp_pool, asize, sizeof(ngx_hash_key_t)) != NGX_OK) {

        return NGX_ERROR;

    }

    ...

}

ngx_int_t

ngx_hash_add_key(ngx_hash_keys_arrays_t *ha, ngx_str_t *key, void *value,

    ngx_uint_t flags)

{

    ...

    //计算hash(key)

    for (i = 0; i < last; i++) {

        if (!(flags & NGX_HASH_READONLY_KEY)) {

            key->data[i] = ngx_tolower(key->data[i]);

        }

        k = ngx_hash(k, key->data[i]);

    }

    k %= ha->hsize;

    /* check conflicts in exact hash */

	//在简易hash表的桶中查找是否有相同key

    name = ha->keys_hash[k].elts;

    if (name) {

        for (i = 0; i < ha->keys_hash[k].nelts; i++) {

            if (last != name[i].len) {

                continue;

            }

            if (ngx_strncmp(key->data, name[i].data, last) == 0) {

                //通过简易hash表判断，找到相同key

                return NGX_BUSY;

            }

        }

    } else {

        if (ngx_array_init(&ha->keys_hash[k], ha->temp_pool, 4, sizeof(ngx_str_t)) != NGX_OK){

            return NGX_ERROR;

        }

    }

	//将key放入简易hash表中

    name = ngx_array_push(&ha->keys_hash[k]);

    if (name == NULL) {

        return NGX_ERROR;

    }

    *name = *key;

	//将不重复的key放入结果ha->keys列表中

    hk = ngx_array_push(&ha->keys);

    if (hk == NULL) {

        return NGX_ERROR;

    }

    hk->key = *key;

    hk->key_hash = ngx_hash_key(key->data, last);

    hk->value = value;

    return NGX_OK;

    ...

}

通配符匹配

nginx支持3种形式的通配符匹配。

.example.com可以匹配example.com和www.example.com
*.example.com 只可以匹配www.example.com不能匹配example.com
www.example.*可以匹配www.example.com

内部是使用3张hash表分别保存精确匹配、头部统配、尾部统配。再查找是也区分精确查找、头部统配查找、尾部统配查找。

typedef struct {

    ngx_hash_t            hash;

    ngx_hash_wildcard_t  *wc_head;

    ngx_hash_wildcard_t  *wc_tail;

} ngx_hash_combined_t;

typedef struct {

    ngx_hash_t        hash;

    void             *value;

} ngx_hash_wildcard_t;//这个结构的含义见下文。

void * ngx_hash_find_combined(ngx_hash_combined_t *hash, ngx_uint_t key, u_char *name, size_t len) {

    void  *value;

    //在精确表查找

    if (hash->hash.buckets) {

        value = ngx_hash_find(&hash->hash, key, name, len);

        if (value) {

            return value;

        }

    }

    if (len == 0) {

        return NULL;

    }

	//在头部统配表查找

    if (hash->wc_head && hash->wc_head->hash.buckets) {

        value = ngx_hash_find_wc_head(hash->wc_head, name, len);

        if (value) {

            return value;

        }

    }

	//在尾部统配表查找

    if (hash->wc_tail && hash->wc_tail->hash.buckets) {

        value = ngx_hash_find_wc_tail(hash->wc_tail, name, len);

        if (value) {

            return value;

        }

    }

    return NULL;

}

关于在前缀表和后缀表种如何查找，需要先了解前缀表和后缀表的结构。

为了查找方便，特别是为了实现头部匹配表的查找，对于3中统配形式会进行一定的变化。

.example.com形式的通配符会在精确表中加入example.com 在头部匹配中加入com.example。
*.example.com形式的通配符会在头部匹配中加入com.example.
www.example.*形式的通配符会在尾部匹配中加入www.example

处理后都就能实现成从左到右分段匹配。处理代码详见ngx_hash_add_key()函数的wildcard:部分该部分有注释，比较好读。

进行初步处理后，就要开始构造分段的hash结构了，相关代码在ngx_hash_wildcard_init()。

示例有以下三个处理后的统配符号和对应的value

{

  www.aaa.com  : X1,

  img.aaa.com  : X2,

  www.bbb.com. : X3,

}

将保存成形如这样的结构

{

  www : {

    aaa : {

      com : X1

    },

    bbb : {

      com : X2

    }

  },

  img : {

    bbb : {

      com : X3

    }

  }

}

nginx开发笔记_ngx_hash源码解析的更多相关文章

odoo开发笔记 -- odoo源码解析
odoo 源码解析:http://blog.csdn.net/weixin_35737303
【Android应用开发】EasyDialog 源码解析
示例源码下载 : http://download.csdn.net/detail/han1202012/9115227 EasyDialog 简介 : -- 作用 : 用于在界面进行一些介绍, 说明; ...
Cognitive Graph for Multi-Hop Reading Comprehension at Scale(ACL2019) 阅读笔记与源码解析
论文地址为:Cognitive Graph for Multi-Hop Reading Comprehension at Scale github地址:CogQA 背景假设你手边有一个维基百科的搜索 ...
Nginx学习笔记4 源码分析
Nginx学习笔记(四) 源码分析源码分析在茫茫的源码中,看到了几个好像挺熟悉的名字(socket/UDP/shmem).那就来看看这个文件吧!从简单的开始~~~ src/os/unix/Ngx_ ...
odoo开发笔记--定时任务源码分析
场景描述: 处理思路: 参考文章: 定时任务相关: https://www.jianshu.com/p/ad48239f84d6 https://blog.csdn.net/M0relia/artic ...
Android 开源项目源码解析（第二期）
Android 开源项目源码解析(第二期) 阅读目录 android-Ultra-Pull-To-Refresh 源码解析 DynamicLoadApk 源码解析 NineOldAnimations ...
Laravel学习笔记之Session源码解析(上)
说明:本文主要通过学习Laravel的session源码学习Laravel是如何设计session的,将自己的学习心得分享出来,希望对别人有所帮助.Laravel在web middleware中定义了 ...
JUC源码学习笔记5——线程池，FutureTask，Executor框架源码解析
JUC源码学习笔记5--线程池,FutureTask,Executor框架源码解析源码基于JDK8 参考了美团技术博客 https://tech.meituan.com/2020/04/02/jav ...
2015.07.20MapReducer源码解析（笔记）
MapReducer源码解析(笔记) 第一步,读取数据源,将每一行内容解析成一个个键值对,每个键值对供map函数定义一次,数据源由FileInputFormat:指定的,程序就能从地址读取记录,读 ...

随机推荐

基于mysql本身的主从复制
mysql的主从复制在我理解而言就是一个主数据库进行增删改操作的时候会自动将数据写入与之关联的从数据库中.这个从数据库可以是一个也可以是多个.(刚开始理解的时候觉得是同一个数据库服务下的不同的data ...
迁移EXT4
http://fanli7.net/a/JAVAbiancheng/ANT/20101003/43604.html 級別: 中級 Roderick W. Smith ,顧問和作家 2008 年6 月0 ...
scrapy之Logging使用
#coding:utf-8 __author__ = 'similarface' ###################### ##Logging的使用 ###################### ...
一、Silverlight中使用MVVM(一)——基础
如果你不知道MVVM模式,我建议你先了解一下MVVM模式,至少要知道实现该模式的意图是什么. 那么我主要通过我认为是已经算是比较简单的例子进行讲解这个模式,当然后面我们会在这个例子的基础上一步一步的进 ...
02 redis通用命令操作
set hi hello 设置值 get hi 获取值 keys * 查询出所有的key memcached 不能查询出所有的key keys *h 模糊查找key keys h[ie] 模糊查找 k ...
不错的iOS相关的主页或站点 (更新于14-06-22)
近期一直没事在翻一些站点看看资料学习下. 推荐几个不错的站点: http://www.raywenderlich.com/ 这个站点有各种各样的教程,可惜是大部分都是英文教程,只是阅读起来还好.每 ...
在WPF对话框中如何验证用户提供的数据
在WPF中,MS在msdn的WPF应用程序开发中对用户输入的数据验证做了示范,基本思想就是添加各种类型的校验规则,比如最大最小值.字符串长度.是否为空等等,在后在界面绑定数据时添加数据字段的校验.这样 ...
设置Eclipse中properties文件打开方式myeclipse一样有source和properties两个视图方法
东北大亨: 说明:如果想在eclipse的properties文件打开的方式出现source和properties视图就需要添加JBossTools插件下面介绍如果添加插件: 1.打开官网 http ...
Java 学习 day03
01-语句(while) 02-语句(do while) 03-语句(for) 04-语句(for和while的区别) 05-语句(循环语句的其他特点) 06-语句(for语句练习-累加&计数 ...
怎么使用Aspose.Cells读取excel 转化为Datatable
说明:vs2012 asp.net mvc4 c# 使用Aspose.Cells 读取Excel 转化为Datatable 1.HTML前端代码 <%@ Page Language=" ...

nginx开发笔记_ngx_hash源码解析