真正理解红黑树,真正的(Linux内核里大量用到的数据结构,且常被二货问到)
我们想,一棵二叉树怎么就是最坏情况,那就是它退化为一个链表,这样查找就成了遍历。问题是,平衡二叉树怎么会退回链表!它是怎么保持平衡的?能不能简单地阐述?当然能够。一般的讲述红黑树的资料都是直接给出黑节点同样。红节点不连续等来作为一个足够硬可是又不是太硬的约束来保证树的平衡,但其实,它还有更加简单的理解方式。
1.查找-在高度不在宽度
对于查找而言。假设一棵二叉树的高度是N。那么最多能够在N步内完毕查找,这个不用解释,解释这个有点喧宾夺主了。这就是说,树的高度要尽可能矮。考虑到查找的平均情况。叶子节点到根节点的距离不能区别太大。
2.二叉树的不平衡根源
一棵树在查找看来变得不平衡是由于子树的高度相差非常大。
二叉树为什么会这么easy变得不平衡,非常easy,由于它仅仅有二叉,左右均有50%的概率,那么插入N个节点所有都是左节点或者右节点的概率就是50%的N次方。假设是8叉树,那么这个概率就是12.5%的N次方。哪个概率大,自己算。
3.多叉树-宽度换高度
在第1节以及第2节。我们已经知道,树的宽度越大,高度越小,这样查询起来越快,Cisco路由器里不是有256叉乃至1024叉树吗?可是这样真的非常好吗?对于稀疏节点,这样会严重消耗内存。
假设我们考虑CPU的MMU系统,就会知道,二级页表和三级页表的区别就在于对付稀疏地址空间的效果不同。
4.权衡-2,3树
我们发现,道生一。一生二。二叉树是一个完美的開始,可是我们发现它特别easy倾斜,倾斜的时候别触摸。我们也不能一下子就上256叉树。即使那样在海量节点情况下也抗不住。因此这样的盲目宽度换高度的方案没有可扩展性。我们须要找出一种动态的机制,让一棵树动态调整保持平衡。
为了更加easy找出这个机制,让它更加easy现形。临时不断添加树的宽度。假设添加到3叉树还找不到方案,就添加到4叉树...我们说的N叉树并非说一个节点一定有N个子节点。而是说它最多有N个子节点。
迄今为止。曾经都是我自己形而上的观点,几年前我的想法就到此为止,原因在于那段时间特别郁闷,就想找出些技术上的形而上思想。可是突然自己变好了。就没有继续下去。幸运的是。我如今发现确实有这么一个方案,而红黑树就是从3叉树回退过去的。
让我高兴的是,我的思路并没有跑偏。
5.2-3树的平衡变换
假设是二叉树。那么你插入一个节点。你仅仅有最多1次机会保持子树的高度不变,假设是一个三叉树,那么就有2次机会。如今開始,我们为二叉树添了一叉。变成了三叉树。
二叉树的时候。一个节点有两个分支,三叉树的时候,有三个分支。一个点能够将区间分为两个部分区域,要想将一个区间分为三个部分区域,就须要两个点,因此三叉的情形下,节点存储的是两个点而不是一个。例如以下图所看到的:
如今考虑插入一个新节点,这个2-3树怎么保持平衡。非常easy,我们知道,插入的位置一定是叶子,假设当前的树是平衡的,如今分两种情况:
1).插入的新叶子节点的父节点是一个二叉节点
这样的情况最简单,二叉节点变三叉节点就可以,例如以下图所看到的:
2).插入的新叶子节点的父节点是一个三叉节点
这样的情况比較复杂。树总是要长高的,保持平衡的方式就是同一时候长高,而这是不可能的,插入一个节点仅仅能让该节点所在的子树长高。然而,假设能将这个信息上升到根部,在根部长高。就实现了“同一时候长高”!
还是循着上面的那个思路。我们继续添加树叉的数量。我们把它添加到4。新节点的插入例如以下图所看到的:
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvZG9nMjUw/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="" />
非常遗憾。没有完毕任务,可是终于我们提出了两个问题,仅仅要攻克了这两个问题,所有问题就攻克了。
解决这两个问题,无疑都要牵扯到节点P的父节点以及再往上的节点。有两种可能:
可能性1:P的父节点PP是一个二叉节点
这个太爽,我们直接把P以及它的子树所有提到PP节点就可以,相似B插入的情景,例如以下图所看到的:
问题2解决。
可能性2:P的父节点PP是一个三叉节点
这就有点不好办了,只是有最后一击!
无论如何先把P节点以及其子节点所有上提到PP,保持最底部的平衡性。这样就能够递归攻克了,此时我们重新遇到了往一个三叉节点里面插入子节点的问题了。为了不添加树高,唯一的方式就是膨胀成一个四叉节点-宽度换高度。例如以下图所看到的:
最后。我们发现,在递归的过程中。要么碰到了P..P是个二叉节点。此时依照问题2的解决方案将当前节点的值直接提到P...P中,其子树减少一个高度,抵消添加的高度。平衡保持。递归结束,要么递归到了根节点。此时仅仅须要一个分裂操作就可以完美结束!
6.演进到红黑树
非常显然,通过上面的描写叙述。我们似乎找到了一个使树保持平衡的方案。并且是相当完美的平衡!核心就是宽度和高度之间的博弈。我们总是能够用一个宽度抵消一层高度,整个过程就是一次或者多次的一加一减,终于的结果还是0!
然而。这也不再是二叉树了,有的节点变成了三叉,并且保存了两个值。该两个值将区间切割成了三部分,是为三叉!
因此在使用上就不如二叉树方便,比較操作复杂化了。其实,将三叉节点处理成二叉节点,这棵树就成了红黑树!怎么处理呢?非常easy。例如以下图所看到的:
看到了吧,红色节点就是从2-3树中分出来的,为了维持一棵二叉树而不是2-3树。必须将三叉节点变成二叉节点,这是一个宽度换高度得回退。即高度换宽度。当然代价就是不再完美平衡。
依照以上的这个变换,你自己试试看,能够变出两个连续的红节点吗?NO!还在纠结红黑树的性质概念吗?看了它的演进,你会发现,非常多红黑树的复杂概念和让人没有头绪的性能都是自然而然的。
以下我们来看一下它的最坏情况是什么。
还是以2-3树分析,假设在一棵2-3树中,最左边路径上的节点所有是三叉节点。而最右边路径上的节点都是二叉节点,那么把它变换成二叉红黑树之后,就会发现最左边的路径上是红黑间隔的节点。而最右边的路径上所有是黑节点,它们的高度差接近2倍。出现这样的情况是令人悲哀的。可是也是极低概率的。
红黑树的所有包含旋转等操作。都能够映射到2-3树中,而我们对2-3树以及高度和宽度之间的博弈已经足够理解了。
请再次去理解红黑树吧,再看看它的性质和概念,together with左旋和右旋。是不是有一种新的体会呢?
真正理解红黑树,真正的(Linux内核里大量用到的数据结构,且常被二货问到)的更多相关文章
- 红黑树(三)之 Linux内核中红黑树的经典实现
概要 前面分别介绍了红黑树的理论知识 以及 通过C语言实现了红黑树.本章继续会红黑树进行介绍,下面将Linux 内核中的红黑树单独移植出来进行测试验证.若读者对红黑树的理论知识不熟悉,建立先学习红黑树 ...
- [翻译]Linux 内核里的数据结构 —— 基数树
目录 Linux 内核里的数据结构 -- 基数树 基数树 Radix tree Linux内核基数树API 链接 Linux 内核里的数据结构 -- 基数树 基数树 Radix tree 正如你所知道 ...
- Linux 内核里的数据结构:位图(bitmap)
注: 本文由 LCTT 原创翻译,Linux中国 荣誉推出 Linux 内核中的位数组和位操作 除了不同的基于链式和树的数据结构以外,Linux 内核也为位数组(或称为位图(bitmap))提供了 A ...
- Linux 内核里的“智能指针”【转】
转自:http://blog.jobbole.com/88279/ 众所周知,C/C++语言本身并不支持垃圾回收机制,虽然语言本身具有极高的灵活性,但是当遇到大型的项目时,繁琐的内存管理往往让人痛苦异 ...
- Linux内核里的DebugFS
DebugFS,顾名思义,是一种用于内核调试的虚拟文件系统,内核开发者通过debugfs和用户空间交换数据.类似的虚拟文件系统还有procfs和sysfs等,这几种虚拟文件系统都并不实际存储在硬盘上, ...
- Linux 内核里的数据结构:双向链表
原文:https://blog.csdn.net/qq_33487044/article/details/78827260 双向链表 Linux 内核自己实现了双向链表,可以在 include/lin ...
- linux内核设计与实现一书阅读整理 之第一二章整合
第一章:Linux内核简介 一.Unix和linux Unix是一个强大.健壮和稳定的操作系统. 1.Unix内核特点 十分简洁:仅提供几百个系统调用并且有明确的目的: 在Unix中,大部分东西都被( ...
- Linux 内核里的数据结构:红黑树(rb-tree)
转自:https://www.cnblogs.com/slgkaifa/p/6780299.html 作为一种数据结构.红黑树可谓不算朴素.由于各种宣传让它过于神奇,网上搜罗了一大堆的关于红黑树的文章 ...
- linux内核中与进程相关的数据结构(基于linux3.16-rc4)
1.进程描述符 struct task_struct { volatile long state; ....... struct list_head tasks; ....... struct mm_ ...
随机推荐
- String.format("%0"+length+"d", arr)中的%0和"d"分别代表什么
public static void main(String[] args) { int a = 8; String s = String.format("%04d", a); S ...
- express结合jade模板渲染HTML
在线html转jade工具>> 注意:以下是在Windwo环境下 运行: npm install jade 然后你的目录node_modules下将增加jade文件夹 app.js var ...
- NSIS安装包制作
6)闪屏界面,可以在源代码中加入下列代码即可: A.普通效果 以下是代码片段: Function .onInit SetOutPath $TEMP File /oname=spltmp.bmp &qu ...
- appium+python自动化49-yaml管理定位元素
前言 如何高效管理定位元素,这个是很有学问的问题,也是面试必问的[以下纯属个人观点,勿喷!]. 有的人用xml管理页面定位元素,这种逼格略高,但是小编认为学习成本大,贼麻烦. 有的人提到用excel管 ...
- web.xml文件的作用及基本配置
Java的web工程中的web.xml文件有什么作用呢?它是每个web工程都必须的吗? 一个web中完全可以没有web.xml文件,也就是说,web.xml文件并不是web工程必须的. 那什么时候需要 ...
- Maven+SpringMVC+Mybatis整合入门Demo
1 数据库准备 (1)建立一个名为mytest的数据库 (2)创建表 CREATE TABLE `t_user` ( `USER_ID` int(11) NOT NULL AUTO_INCREMENT ...
- C#/Sqlite-SQLite PetaPoco django 打造桌面程序
为什么是 SQLite? 在以前的程序中, 我通常会使用 MySQL. 如果使用你程序的用户是一个软件小白, 而且远在另一个城市, 那么让她安装和部署 MySQL 将是一场噩梦: 她需要配置服务, 面 ...
- 我的Android进阶之旅------>Android实现音乐示波器、均衡器、重低音和音场功能
本实例来自于<疯狂Android讲义>.要实现详细的功能,须要了解下面API: MediaPlayer 媒体播放器 Visualizer 频谱 Equalizer 均衡器 BassBoo ...
- IM开发基础知识补课(四):正确理解HTTP短连接中的Cookie、Session和Token
本文引用了简书作者“骑小猪看流星”技术文章“Cookie.Session.Token那点事儿”的部分内容,感谢原作者. 1.前言 众所周之,IM是个典型的快速数据流交换系统,当今主流IM系统(尤其移动 ...
- RTP 时间戳的处理
RTP 时间戳的处理 在RTP传输音频数据时,一般选定逻辑时间戳速率与采样速率相同, 但是在传输视频数据时,必须使时间戳速率大于每帧的一个滴答(这样才能使图像回放更为平滑--<用TCP/IP ...