转自:http://blog.csdn.net/bailyzheng/article/details/8041943

linux中的优先搜索树的实现--prio_tree

prio_tree在linux内核中被应用于反向内存映射,prio-tree是一棵查找树,它查找的是一个区间,为何将之组织成tree是一个数学问题,简单理解就是根节点包含了所有的区间,父节点代表的区间包含了子节点代表的区间,这里的包含不是现实意义的包含,而是heap/radix意义上的包含,只要满足heap的性质以及radix的性质即可,不过大多数情况下包含的意义就是现实意义的包含,Documentation中的prio_tree.txt中的图示可以看一下,[4,3,7]是[5,2,7]和[6,1,7]的父节点,父节点区间“现实包含”了两个子节点区间,而[5,2,7]是[4,2,6]和[5,1,6]的父节点, [5,2,7]就没有“现实包含”[4,2,6],但是仍然是后者的父节点,因为它们满足了heap的性质,[5,2,7]的heap-index是7,大于[4,2,6]的heap-index。由于prio-tree首先要是一个heap(插入过程中详细说明)--处理父子关系,其次要是一个radix树--处理兄弟关系,父子间满足了heap之后还要在兄弟间满足radix性质,总之,prio-tree节点间的关系有两个层次的两种,第一层,父子关系,必须符合heap性质,第二层,兄弟关系,必须符合radix性质。
     以上简要介绍了prio-tree的性质,是所有实现的共性,linux内核的实现实现了自己的个性,如果看代码的话就会发现,linux引入了一些变量或者约束,使得prio-tree在性能,资源消耗以及代码可读性之间做出了一个完美的平衡,最值得推崇的就是linux的prio-tree中维护了一个图表,该图表约束了prio-tree的高度,该图表以一个数组实现,数组的内容其实就是该索引下最大的heap,每一个树节点都有一个index_bits字段,它表示了用index_bits个比特就能表达最大的heap,而此index_bits减1正是“这么些”比特在数组中的下标,图表如下:
bit-used    array-index    max-heap
1        0        1
2        1        11
3        2        111
4        3        1111
由上面的图表1可以推导出下面的等式,下面的等式优化了树的性能,促使了数的平衡,并且巧妙的处理了兄弟之间的关系,使之符合prio-tree的原始约束:
bit-used+1=tree-height  (等式1)
根据上述等式,mask=1UL<< (root->index_bits - 1);,这个mask代表了“当前处理的层”的最高位,它决定了待插入节点是插入左孩子还是插入右孩子。插入过程中,每下将一层,mask要右移一位,由于prio-tree是一棵二叉树,因此二进制的0和1就能决定左和右,这个性质和二叉radix查找树是一样的,一个二进制的数是由0和1组成的串,如果欲将之插入一棵radix树,那么从待插节点最高位开始依次从树根处开始和树中节点的相应位进行"&"操作,根据结果来进行左右抉择,每下降一层,比较位就右移一位,直到成功插入,这样就保证了树的radix性质,上述等式1其实并不是必不可少的,它的作用更大的意义是优化,包括代码紧凑度的优化以及时间空间的优化,没有它的话,代码不可能写成现在的prio_tree.c中如此紧凑又容易理解的形式,同时一棵树还会因为频繁的插入和删除而变得很高,这样对查找来讲是很不利的,正如宏黑树用颜色来约束平衡,AVL树用高度来约束平衡一样,prio-tree用上述等式1来约束平衡。既然用radix性质实现了一棵radix树,我们还可以用heap性质来构造一个heap,本质上也是一棵二叉树,如果将二者合并的话,就是prio-tree了,而heap的性质主要体现在父子上面,对兄弟之间并没有多大的约束,因此在prio-tree的插入过程中,基本分为三大块,第一大块是实现heap的性质,在此基础上,第二大快对待左右抉择的时候利用radix的性质以及radix的插入逻辑实现插入,两大块保证了prio-tree的性质,但是不能保证平衡性,由此在此两块的基础上尽量保证树的平衡,于是等式1起作用,以上的三块联动已经近乎完美了,但是理想情况往往不能尽满足现实需求,很多的节点都拥有相同的radix,那么根据heap的性质,它们最终将成为一个近似链表的东西,因此如果为了处理这些链表二增加树的高度(增加max-heap),那么树看起来会很不平衡的,因此单独列出一个overflow-sub-tree来处理这种情况,加入这个性质之后,prio-tree实则成了一个集heap,radix树,链表于一身的集大成,最终的结果就是prio_tree.c中的prio_tree_insert函数的实现:
insert:
cur = root->prio_tree_node;
mask = 1UL << (root->index_bits - 1);
while (mask) {
    GET_INDEX(cur, r_index, h_index);
    if (r_index == radix_index && h_index == heap_index)
        return cur;
        if (h_index < heap_index || //破坏了父子约束,因此需要交换父子
        (h_index == heap_index && r_index > radix_index)) {
        struct prio_tree_node *tmp = node;
        node = prio_tree_replace(root, cur, node);
        cur = tmp;  //需要插入的node现在已经成了被替换的node
        index = r_index; //交换所有的索引,heap索引和radix索引
        ...
    }
    if (size_flag) 
        index = heap_index - radix_index;
    else
        index = radix_index;
    if (index & mask) { //此处的if-else用于确定兄弟约束,对应位为1则往右走
        ...//右孩子为空的话直接插入右孩子的位置,返回
    } else //否则返回右孩子
        cur = cur->right;
    } else {  //对应位为0则往左走
        ...//左孩子为空的话直接插入左孩子的位置,返回
    } else //否则返回左孩子
        cur = cur->left;
    }
    mask >>= 1;  //进入下一层的radix抉择
    if (!mask) {  //处理overflow树
        mask = 1UL << (root->index_bits - 1);
        size_flag = 1;
    }
}
由于heap和radix树的逻辑都是执行过程中体现的,并且都是确定的,只有那个图表1相关的代码是prio-tree独有的,因此在prio_tree_init中必然要进行相关的初始化,可以看出,prio_tree_init进行的仅仅是图表1相关的初始化,初始化完成以后,从图表1就可以推出等式1了,由此prio-tree的运行所需要的基础设施就全部到位了:
void __init prio_tree_init(void)
{
    unsigned int i;
    for (i = 0; i < ARRAY_SIZE(index_bits_to_maxindex) - 1; i++)
        index_bits_to_maxindex[i] = (1UL << (i + 1)) - 1;
    index_bits_to_maxindex[ARRAY_SIZE(index_bits_to_maxindex) - 1] = ~0UL;
}
很多树节点的remove操作都很复杂,甚至比insert还要复杂,但是对于prio-tree来讲却是很简单的,因为prio-tree节点的heap特性,并且整个prio-tree首先肯定是一个heap,所谓的radix只是在对兄弟无约束的heap加上了兄弟间的约束而已,因此remove操作完全实际上就是一个heap调整的过程,调整完heap之后无需再关心树的radix性质,因为它只要首先是一个heap即可,在remove的每一步操作中,只要能保证树的heap性质就可以了,只需要从待删除节点往下沿着大孩子走一直到叶节点,然后再回溯回来即可,回溯过程中需要依次的将当前节点和父节点进行对换,依次进行,最终就是待删除节点的大孩子替换了待删除节点,删除至此结束,至于忽略了radix性质是否会带来树的不平衡,答案是可能不会也可能会,但不甚会,如果在remove操作时加上树的平衡性维护,那么代码将变得复杂,同时也会影响到效率。

linux中的优先搜索树的实现--prio_tree【转】的更多相关文章

  1. 在linux中设置优先使用ipv4,而不是ipv6

    背景: 有时候更新源的时候默认使用ipv6,而ipv6下载数据时候总出现问题. 所有想默认出口的时候优先使用ipv4出口访问,而不是ipv6. 要使用ipv4 连接优先而不必禁用ipv6,需要修改ga ...

  2. Linux中检索文件

    1 , Use locate command It is a fast way to find the files location, but if a file just created ,it w ...

  3. 浅谈Linux中的信号处理机制(二)

    首先谢谢 @小尧弟 这位朋友对我昨天夜里写的一篇<浅谈Linux中的信号处理机制(一)>的指正,之前的题目我用的“浅析”一词,给人一种要剖析内核的感觉.本人自知功力不够,尚且不能对着Lin ...

  4. 在Linux中创建静态库.a和动态库.so

    转自:http://www.cnblogs.com/laojie4321/archive/2012/03/28/2421056.html 在Linux中创建静态库.a和动态库.so 我们通常把一些公用 ...

  5. Linux就这个范儿 第15章 七种武器 linux 同步IO: sync、fsync与fdatasync Linux中的内存大页面huge page/large page David Cutler Linux读写内存数据的三种方式

    Linux就这个范儿 第15章 七种武器  linux 同步IO: sync.fsync与fdatasync   Linux中的内存大页面huge page/large page  David Cut ...

  6. Linux中命令链接操作符的十个最佳实例

    转载: http://www.linuxeden.com/html/softuse/20140112/147406.html http://www.tecmint.com/chaining-opera ...

  7. 在Linux中创建静态库和动态库

    我们通常把一些公用函数制作成函数库,供其它程序使用. 函数库分为静态库和动态库两种. 静态库在程序编译时会被连接到目标代码中,程序运行时将不再需要该静态库. 动态库在程序编译时并不会被连接到目标代码中 ...

  8. linux中shell编程

    shell编程 1 echo -e 识别\转义符 \a \b \t \n \x十六进制 \0八进制 等等 #!/bin/bash echo -e "hello world" 执行脚 ...

  9. Linux中.a,.la,.o,.so文件的意义和编程实现

    Linux中.a,.la,.o,.so文件的意义和编程实现    Linux下文件的类型是不依赖于其后缀名的,但一般来讲:        .o,是目标文件,相当于windows中的.obj文件     ...

随机推荐

  1. 【干货】分享总结:MySQL数据一致性 罗小波 星辉天拓

    [干货]分享总结:MySQL数据一致性  罗小波  星辉天拓 http://mp.weixin.qq.com/s?__biz=MjM5NzAzMTY4NQ==&mid=2653928966&a ...

  2. CentOS设置虚拟网卡做NAT方式和Bridge方式桥接

    CentOS设置虚拟网卡做NAT方式和Bridge方式桥接 http://www.centoscn.com/CentOS/config/2015/0225/4736.html 摘要:KVM虚拟机网络配 ...

  3. centos vmware centos6.6 64位 kvm虚拟化安装配置 第四十二节课

    centos vmware centos6.6 64位 kvm虚拟化安装配置     第四十二节课 上半节课 下半节课 f

  4. saltstack故障解决

    [root@saltstack_s ~]# salt '*' test.pingSalt request timed out. The master is not responding. If thi ...

  5. Highcharts动态赋值学习

    最近老大让做项目中的统计图表功能,需要使用highcharts这个插件,弄出来了两种类型的图表动态赋值的实现,首先贴上中文网的官网和api地址,使用这个英语不好的同学肯定会用到的: 中文网官网:htt ...

  6. jango_modles_views显示

    views #!/usr/bin/env python #__coding:utf-8__ from django.shortcuts import render,render_to_response ...

  7. PHP Tab的Demo

    <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...

  8. Hive -- 基于Hadoop的数据仓库分析工具

    Hive是一个基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库 ...

  9. Java基础之线程——使用Runnable接口(JumbleNames)

    控制台程序. 除了定义Thread新的子类外,还可以在类中实现Runnable接口.您会发现这比从Thread类派生子类更方便,因为在实现Runnable接口时可以从不是Thread的类派生子类,并且 ...

  10. Java基础之一组有用的类——使用正则表达式搜索子字符串(TryRegex)

    控制台程序. 正则表达式只是一个字符串,描述了在其他字符串中搜索匹配的模式.但这不是被动地进行字符序列匹配,正则表达式其实是一个微型程序,用于一种特殊的计算机——状态机.状态机并不是真正的机器,而是软 ...