AVL树

AVL树的概念

二叉搜索树虽可以缩短查找的效率,但如果数据有序或接近有序二叉搜索树将退化为单支树,查找元素相当于在顺序表中搜索元素,效率低下。因此,两位俄罗斯的数学家G.M.Adelson-Velskii和E.M.Landis在1962年发明了一种解决上述问题的方法:当向二叉搜索树中插入新结点后,如果能保证每个结点的左右子树高度之差的绝对值不超过1(需要对树中的结点进行调整),即可降低树的高度,从而减少平均搜索长度。

一棵AVL树或者是空树,或者是具有以下性质的二叉搜索树:

  • 它的左右子树都是AVL树

  • 左右子树高度之差(简称平衡因子)的绝对值不超过1(-1/0/1)

    (默认平衡因子=右子树高度-左子树高度)

如果一棵二叉搜索树是高度平衡的,它就是AVL树。如果它有n个结点,其高度可保持在$O(log_2 n)$,搜索时间复杂度O($log_2 n$)。

AVL树是由BST二叉搜索树改进而来,基本概念参考BST篇,本篇文章不再详细描述.

AVL树节点的定义:

template<class K, class V>
struct AVLTreeNode
{
//三叉链: left right parent
AVLTreeNode* _left;   // 该节点的左孩子
AVLTreeNode* _right;  // 该节点的右孩子
AVLTreeNode* _parent; // 该节点的双亲
std::pair<K,V> _kv; // 键值对
int _bf;             // 该节点的平衡因子 balance factor AVLTreeNode(const std::pair<K, V>& kv)
:_left(nullptr)
, _right(nullptr)
, _parent(nullptr)
, _kv(kv)
, _bf(0)
{}
};

AVL树的插入

基本情况分析

AVL树就是在二叉搜索树的基础上引入了平衡因子,因此AVL树也可以看成是二叉搜索树。那么AVL树的插入过程可以分为两步:

  1. 按照二叉搜索树的方式插入新节点

  2. 调整节点的平衡因子

    a. 更新父结点平衡因子

    b. 根据父结点的平衡因子进行相应的操作

对于平衡因子

插入新结点后,首先可能会影响父结点的平衡因子,迭代往上,可能还会影响部分或全部(到根节点)祖先结点的平衡因子.

具体地说,即插入新结点后,需要根据父结点平衡因子的情况,决定是否继续往上对祖结点进行更新平衡因子,最多到达根结点.

平衡因子对应的操作

父结点平衡因子如何决定是否继续往上更新? 取决于更新后parent->_bf的值

  1. parent->_bf == 1 || parent->_bf == -1 ,说明插入前的父结点一定是左右子树高度相等,即_bf为0.新增结点后父结点所在子树高度一定发生变化,爷爷结点所在子树也可能发生变化,因此需要进行迭代更新祖先平衡因子.

    不可能是2或-2变成1或-1,因为这是AVL树的插入,至少先保证是AVL树才能插入

  2. parent->_bf == 2 || parent->_bf == -2 ,说明插入前的父结点所在子树一边高一边低,之后新结点恰好插入到了高的一边,导致不平衡,需要做旋转操作,调整平衡.

  3. parent->_bf == 0,插入后父结点的平衡因子平衡,说明原先父结点的左右子树是一边高一边低,然后插入刚好插到了低的一边,使其平衡.插入结束.

旋转操作

分析需要旋转的情况

首先,要针对AVL子树,找出/抽象出可能发生旋转的情况。

一棵可能发生旋转的树至少高度差为1,即两个结点以上。(前提)

						(可能会发生旋转的子树至少两个结点以上)

其中a,b,c是三棵AVL子树

  • 当子树高度h==0时,即a、b、c都为空树

  • 当子树高度h==1时,a、b、c都是叶子结点

  • 当子树高度h==2时,a、b、c分别有三种情况

    此时这个AVL子树有3*3*3=27种情况:a为x/y/z,b为x/y/z,c为x/y/z。

  • 如此往下,还有更多的情况,但全部形状都可以用图中模型来代替。

以h==2为例,只有当b或c为z情况时,插入到b或c子树会影响到根结点(30),并使其发生旋转。

其他情况都无法使其发生旋转。因此,当前可以总结出2种需要旋转的情况:

  1. c为z时,插到c中(左左)
  2. b为z时,插到b中(左右)

左左:较高的子树是左孩子(60)所在子树,插到左孩子(60)的左子树上(c)引发根(30)旋转的情况叫“左左”。

顺口:插在较高左子树的左孩子上。

同理,水平镜像翻转的AVL子树也同理

  1. c为z时,插到c中(右右)
  2. b为z时,插到b中(右左)
结论

合并起来总共4种需要旋转的情况,验证其他高度也同样如此。

其中插入b子树使30结点发生旋转的情况:a为x/y/z,b为z,c为x/y/z,总共3*3=9种

其中插入c子树使30结点发生旋转的情况:a为x/y/z,b为x/y/z,c为z,总共3*3=9种

特例的数量非常多,无法穷举。

4种旋转操方法与特征
  1. 新节点插入较高左子树的左侧---左左:右单旋

    • 特征

      父:-2

      子:-1

    最左边高,旧根的左孩子变成新根,旧根成为新根的右孩子,同时领养新根的旧右孩子。

    儿子上位 -- 儿子当根

    右单旋(主角是儿子):老爹在我的右上方,让老爹以我为轴,旋转到我的右下方

  2. 新节点插入较高右子树的右侧---右右:左单旋

    • 特征

      父:2

      子:1

    最右边高,旧根的右孩子变成新根,旧根成为新根的左孩子,同时领养新根的旧左孩子。

  3. 新节点插入较高左子树的右侧---左右:先左单旋再右单旋

    • 特征

      父:-2

      子:1

    1. 旧根的左儿子的右孩子(简称右孙子)高:让右孙子成为旧根的左孩子,旧左孩子变成孙子的左孩子,同时领养孙子的左孩子。 -- 对右孙子做左旋操作
    2. 右孙子成为旧根的新左儿子,再对新作儿子做右旋操作即可。

    孙子上位 --- 孙子当根

    感性描述:先左单旋再右单旋(孙子是主角):我在孙子左边,我的老爹在孙子右边,然后让孙子的爹(我)左旋下来,孙子成为我的爹,我的旧爹成为孙子的爹;最后再让孙子的新爹右旋下来。

    描述2: 两次旋转分别用途: 1. 转化成标准单旋; 2.标准单旋

  4. 新节点插入较高右子树的左侧---右左:先右单旋再左单旋

    • 特征

      父:2

      子:-1

总共4种旋转的情况:

  1. 右旋(左左)
  2. 左旋(右右)
  3. 先左旋再右旋(左右)
  4. 先右旋再左旋(右左)

简要图:

6种双旋平衡因子特征

容易发现单旋平衡因子都是0(高度差为0),而双旋平衡因子较为复杂,观察规律总结出一共6种情况。

  1. 左右左(h>0)

    • 旧(特征)

      孙:-1

    • 父:1

      子:0

      孙:0

  2. 左右右(h>0)

    • 旧(特征)

      孙:1

    • 父:0

      子:-1

      孙:0

  1. 右左右(h>0)

    • 旧(特征)

      孙:1

    • 父:-1

      子:0

      孙:0

  2. 右左左(h>0)

    • 旧(特征)

      孙:-1

    • 父:0

      子:1

      孙:0

  3. 左右,特例(h==0)

    • 旧(特征)

      孙:0

    • 父:0

      子:0

      孙:0

  4. 右左(h==0),与5相同

    • 旧(特征)

      孙:0

    • 父:0

      子:0

      孙:0

代码实现

四种旋转实现
 //1. 右右
void RotateL(Node* parent) {
//. 记录爷爷(父亲的父亲)
//. 我是父的右儿子(我是主角)
//. 记录下我的左子树(托管)
// 旋转(爷、父、子关系重新调整)
// 成为爷爷的右儿子 (如果没有爷爷,则跳过;且说明父是根,更新我成为根)
// 把我的左子树托管给父成为他的右孩子
// 旧父成为我的左儿子,旧父的父更新成我
//. 更新平衡因子 //. 记录爷爷(父亲的父亲)
//. 我是父的右儿子
//. 记录下我的左子树
Node* pparent = parent->_parent;
Node* cur = parent->_right;
Node* leftchild = cur->_left; //旋转
//. 成为爷爷的右儿子 (如果没有爷爷,则跳过;且说明父是根,更新我成为根)
if (pparent) { //有爷爷
if(parent == pparent->_left)
pparent->_left = cur;
else {
pparent->_right = cur;
}
cur->_parent = pparent; //三叉链维护
}
else { //没有爷爷,父亲是根
cur->_parent = nullptr;
_root = cur;
}
//. 父子地位交换
parent->_right = leftchild;
if (leftchild) { //三叉链维护
leftchild->_parent = parent;
}
cur->_left = parent;
parent->_parent = cur;
//旋转 【end】 //更新平衡因子
cur->_bf = 0;
parent->_bf = 0;
} //2. 左左
void RotateR(Node* parent) {
//. 记录爷爷
//. 我是父的左儿子
//. 记录下我的右子树
Node* pparent = parent->_parent;
Node* cur = parent->_left;
Node* rightChild = cur->_right; //旋转
//. 成为爷爷的左儿子 (如果没有爷爷,则跳过;且说明父是根,更新我成为根)
if (pparent) { //有爷爷
if (parent == pparent->_left)
pparent->_left = cur;
else {
pparent->_right = cur;
}
cur->_parent = pparent; //三叉链维护
}
else { //没有爷爷,父亲是根
cur->_parent = nullptr;
_root = cur;
}
//. 父子地位交换
parent->_left = rightChild;
if (rightChild) { //三叉链维护
rightChild->_parent = parent;
}
cur->_right = parent;
parent->_parent = cur;
//旋转 【end】 //更新平衡因子
cur->_bf = 0;
parent->_bf = 0; }
//3. 左右
void RotateLR(Node* parent) {
//我是儿子,但是主角是孙子
//记录下孙子
//记录下孙子的平衡因子(特征)
//对孙子进行左单旋,再右旋
//更新平衡因子
Node* cur = parent->_left;
Node* grandson = cur->_right;
int bf = grandson->_bf; RotateL(cur);
RotateR(grandson->_parent); //三种情况
if (bf == 0) {
parent->_bf = 0;
cur->_bf = 0;
grandson->_bf = 0;
}
else if (bf == 1) {
parent->_bf = 0;
cur->_bf = -1;
grandson->_bf = 0;
}
else if (bf == -1) {
parent->_bf = 1;
cur->_bf = 0;
grandson->_bf = 0;
}
else {
assert(false); //错误检查
}
} //4. 右左
void RotateRL(Node* parent) {
//我是儿子(父的右孩子),但是主角是孙子
//记录下孙子(我的左孩子)
//记录下孙子的平衡因子(特征)
//对孙子进行右单旋,再左单旋
//更新平衡因子
Node* cur = parent->_right;
Node* grandson = cur->_left;
int bf = grandson->_bf; RotateR(cur); //将孙子的爹,就是我,进行右单旋
RotateL(grandson->_parent); //将儿子的新爹进行左单旋 //三种情况
if (bf == 0) {
parent->_bf = 0;
cur->_bf = 0;
grandson->_bf = 0;
}
else if (bf == 1) {
parent->_bf = -1;
cur->_bf = 0;
grandson->_bf = 0;
}
else if (bf == -1) {
parent->_bf = 0;
cur->_bf = 1;
grandson->_bf = 0;
}
else {
assert(false);
}
}
插入操作实现
    bool Insert(const std::pair<K,V> kv) {
//第一个结点做根
if (_root == nullptr) {
_root = new Node(kv);
_size++;
return true;
} //搜索
Node* parent = _root;
Node* cur = _root;
while (cur) {
//大于往右走
if (kv.first > cur->_kv.first) {
parent = cur;
cur = cur->_right;
}
//小于往左走
else if (kv.first < cur->_kv.first) {
parent = cur;
cur = cur->_left;
}
//找到了,存在相同的key
else {
return false;
}
} //循环搜索... //不存在,可以插入
cur = new Node(kv); //new后,cur值发生改变,之后都不能使用地址进行比较
if (cur->_kv.first < parent->_kv.first) {
parent->_left = cur;
}
else {
parent->_right = cur;
}
cur->_parent = parent; //三叉链链上父结点
_size++; //调整平衡因子 : 最多到根,根的parent为nullptr
while (parent) { //更新平衡因子
if (cur->_kv.first < parent->_kv.first) {
parent->_bf--;
}
else {
parent->_bf++;
} //看是否需要调整
if (parent->_bf == 1 || parent->_bf == -1) {
cur = parent;
parent = parent->_parent;
}
else if(parent->_bf == 0){
break;
}
else if(parent->_bf == 2 || parent->_bf == -2){
if (parent->_bf == -2 && cur->_bf == -1) { //左左
RotateR(parent);
}
else if (parent->_bf == 2 && cur->_bf == 1) { //右右
RotateL(parent);
}
else if (parent->_bf == -2 && cur->_bf == 1) { //左右
RotateLR(parent);
}
else if(parent->_bf == 2 && cur->_bf == -1){ //右左
RotateRL(parent);
}
else { //错误检查
assert(false);
}
break;
}
else {
assert(false);
}
} return true;
}
树高度与是否平衡树判断实现
    size_t Hight() {
return _Hight(_root);
} bool IsBalance() {
return _IsBalance(_root);
} size_t _Hight(Node* root) {
if (root == 0) return 0; //空
size_t leftH = _Hight(root->_left);
size_t rightH = _Hight(root->_right);
return std::max(leftH, rightH) + 1; //+1:自己高度为1
} bool _IsBalance(Node* root) {
if (root == nullptr) return true;
int leftH = _Hight(root->_left);
int rightH = _Hight(root->_right);
int bf = rightH-leftH;
return bf == root->_bf //平衡因子
&& (bf > -2 && bf < 2) //高度差
&& _IsBalance(root->_left)
&& _IsBalance(root->_right);
}
其他实现
#include<iostream>
#include<string>
#include<cassert> template<class K,class V>
struct AVLTreeNode { //三叉链
AVLTreeNode<K,V>* _left;
AVLTreeNode* _right;
AVLTreeNode* _parent; int _bf; //balance factor
std::pair<K,V> _kv; AVLTreeNode(const std::pair<K,V>& kv)
:_left(nullptr),
_right(nullptr),
_parent(nullptr),
_bf(0),
_kv(kv)
{}
}; template<class K,class V>
class AVLTree {
public:
using Node = AVLTreeNode<K, V>;
AVLTree()
:_root(nullptr)
,_size(0)
{} public:
void InOrder() {
_InOrder(_root);
std::cout<<std::endl;
} private:
void _InOrder(Node* root) {
if (root == nullptr) {
return ;
}
_InOrder(root->_left);
std::cout<<root->_kv.first<<" ";
_InOrder(root->_right);
} private:
Node* _root;
size_t _size;
};

插入验证

  1. 两个数组包含各种旋转情况
  2. 每插入都判断是否平衡
int main() {
std::cout<<std::boolalpha;
//int a[] = { 4, 2, 6, 1, 3, 5, 15, 7, 16,14 };
int a[] = { 16, 3, 7, 11, 9, 26, 18, 14, 15 };
AVLTree<int, int> t;
for (int it : a) {
t.Insert(std::make_pair(it, it));
std::cout << "是否平衡: " << t.IsBalance() << std::endl;
} t.InOrder(); //3 7 9 11 14 15 16 18 26
}

BenchMark

环境
架构: x86_64
CPU 运行模式: 32-bit, 64-bit
CPU: 16
在线 CPU 列表: 0-15
型号名称: AMD Ryzen 7 7840HS w/ Radeon 780M
CPU MHz: 3792.879
L1d 缓存: 512 KiB
L1i 缓存: 512 KiB
L2 缓存: 16 MiB
L3 缓存: 256 MiB
系统: Win10
IDE: VS2019
测试工具和方法

工具

  • void RandomArray_Generator(int* a, int n):随机数生成器
  • void Cost(std::function<void(void)> func):计算函数执行时间花销。使用包装器接收任意可调用对象

测试方法

​ 计算1000000个随机数,有序数,逆序数,重复数插入的时间开销。

void RandomArray_Generator(int* a, int n) {
std::random_device rnd;//random num device //效率低,只用于生成种子
std::mt19937 rng(rnd()); //random num generator -- 生成随机数
std::uniform_int_distribution<int> uni(0, 1000000000);//整型区间筛选
//[0-N]有6成为不重复,4成重复 --若需要9成不重复需要扩大筛选范围为10倍的N,即插入N需筛选10N //int a[] = { 3,1,8,4,2,7,5,9,6,0 }; //自定义数组
int size = n;
for (int i = 0; i < size; i++) {
a[i] = uni(rng); //随机数
//a[i] = size - i; //逆序
//a[i] = i; //正序
//a[i] = size/2; //重复数
if (i % 10000 == 0) {
a[i] = uni(rng); //插入一些随机数
}
}
} void Cost(std::function<void(void)> func) {
auto begin = std::chrono::high_resolution_clock::now();
func();
auto end = std::chrono::high_resolution_clock::now();
std::chrono::duration<double> cost = end - begin;
std::cout<<cost.count()<<"/s" << std::endl;
} void InsertTest(AVLTree<int,int>& t, int* a, int size) {
for (int i = 0; i < size; i++) {
t.Insert(std::make_pair(a[i], a[i]));
//if (t.IsBalance() == false) assert(false);
}
} int main() {
//int a[] = { 16, 3, 7, 11, 9, 26, 18, 14, 15 };
//int a[] = { 4, 2, 6, 1, 3, 5, 15, 7, 16,14 };
int size = 1000000;
int* a = new int[size];
RandomArray_Generator(a,size);
AVLTree<int, int> t;
InsertTest(t,a,size);
Cost([&](){std::cout<<"cost: ";InsertTest(t, a, size); });
//t.InOrder();
std::cout<<std::boolalpha;
std::cout << "是否平衡: " << t.IsBalance() << std::endl;
}
测试结果:
  • 随机数

  • 逆序数

  • 正序数

  • 重复数

平衡搜索树-AVL树 图文详解 (万字长文)的更多相关文章

  1. B树和B+树的插入、删除图文详解(good)

    B树和B+树的插入.删除图文详解 1. B树 1. B树的定义 B树也称B-树,它是一颗多路平衡查找树.我们描述一颗B树时需要指定它的阶数,阶数表示了一个结点最多有多少个孩子结点,一般用字母m表示阶数 ...

  2. 面渣逆袭:Redis连环五十二问,图文详解,这下面试稳了!

    大家好,我是老三,面渣逆袭系列继续,这节我们来搞定Redis--不会有人假期玩去了吧?不会吧? 基础 1.说说什么是Redis? Redis是一种基于键值对(key-value)的NoSQL数据库. ...

  3. SPSS学习系列之SPSS Modeler的功能特性(图文详解)

    不多说,直接上干货! Win7/8/10里如何下载并安装最新稳定版本官网IBM SPSS Modeler 18.0 X64(简体中文 / 英文版)(破解永久使用)(图文详解)   我这里,是以SPSS ...

  4. 树-二叉搜索树-AVL树

    树-二叉搜索树-AVL树 树 树的基本概念 节点的度:节点的儿子数 树的度:Max{节点的度} 节点的高度:节点到各叶节点的最大路径长度 树的高度:根节点的高度 节点的深度(层数):根节点到该节点的路 ...

  5. 图文详解压力测试工具JMeter的安装与使用

    压力测试是目前大型网站系统的设计和开发中不可或缺的环节,通常会和容量预估等工作结合在一起,穿插在系统开发的不同方案.压力测试可以帮助我们及时发现系统的性能短板和瓶颈问题,在这个基础在上再进行针对性的性 ...

  6. 高级搜索树-AVL树

    目录 平衡因子 AVL树节点和AVL树的定义 失衡调整 插入和删除操作 完整源码 AVL树是平衡二叉搜索树中的一种,在渐进意义下,AVL树可以将高度始终控制在O(log n) 以内,以保证每次查找.插 ...

  7. 图文详解两种算法:深度优先遍历(DFS)和广度优先遍历(BFS)

    参考网址:图文详解两种算法:深度优先遍历(DFS)和广度优先遍历(BFS) - 51CTO.COM 深度优先遍历(Depth First Search, 简称 DFS) 与广度优先遍历(Breath ...

  8. CentOS 6.3下Samba服务器的安装与配置方法(图文详解)

    这篇文章主要介绍了CentOS 6.3下Samba服务器的安装与配置方法(图文详解),需要的朋友可以参考下   一.简介  Samba是一个能让Linux系统应用Microsoft网络通讯协议的软件, ...

  9. Cocos2d-x win7 + vs2010 配置图文详解

    Cocos2d-x win7 + vs2010 配置图文详解 下载最新版的cocos2d-x.打开浏览器,输入cocos2d-x.org,然后选择Download,本教程写作时最新版本为cocos2d ...

  10. zookeeper的安装(图文详解。。。来点击哦!)

    zookeeper的安装(图文详解...来点击哦!) 一.服务器的配置 三台服务器: 192.168.83.133   sunshine 192.168.83.134   sunshineMin 19 ...

随机推荐

  1. python重拾第十三天-那就做个堡垒机吧

    本节内容 项目实战:运维堡垒机开发 前景介绍 到目前为止,很多公司对堡垒机依然不太感冒,其实是没有充分认识到堡垒机在IT管理中的重要作用的,很多人觉得,堡垒机就是跳板机,其实这个认识是不全面的,跳板功 ...

  2. python重拾第十一天-REDIS缓存数据库

    缓存数据库介绍 NoSQL(NoSQL = Not Only SQL ),意即"不仅仅是SQL",泛指非关系型的数据库,随着互联网web2.0网站的兴起,传统的关系数据库在应付we ...

  3. Android 通过odex优化提高首次开机速度

    背景 客户反馈说开机时间过长,需要优化. 原文:https://blog.csdn.net/croop520/article/details/73930184 介绍 现在很多Android都需要预装很 ...

  4. Nuxt3 的生命周期和钩子函数(六)

    title: Nuxt3 的生命周期和钩子函数(六) date: 2024/6/30 updated: 2024/6/30 author: cmdragon excerpt: 摘要:本文深入解析了Nu ...

  5. 微服务上云Dockerfile编写,如何上云时将生产环境和开发环境分离并正确书写自定义启动命令

    点击查看代码 FROM openjdk:8-jdk LABEL maintainer=yao #docker run -e PARAMS="--server.port 9090" ...

  6. 基于RK3588的NPU案例分享!6T是真的强!

    RK3588 NPU简介 作为瑞芯微新一代旗舰工业处理器,RK3588 NPU性能可谓十分强大,6TOPS设计能够实现高效的神经网络推理计算.这使得RK3588在图像识别.语音识别.自然语言处理等人工 ...

  7. sqoop导入导出到mysql,hbase,hive,hdfs系统,多表关联导出案例

    Sqoop工具1.协助 RDBMS 与 Hadoop 之间进行高效的大数据交流.把关系型数据库的数据导入到 Hadoop 与其相关的系统 (如HBase和Hive)同时也可以把数据从 Hadoop 系 ...

  8. BZOJ 1461 题解

    考虑设计一个哈希函数 \(hash(x) = f(x) \times base^x\). 其中 \(f(x)\) 表示 \(\sum_{j=1}^{i-1} [j <i]\). 然后类似于滑动窗 ...

  9. Docker 总体架构图解

    Docker 的总体架构 Docker 是一个 C/S 模式的架构,后端是一个松耦合架构,模块各司其职. 下图是它的总体架构图: 1. 用户使用 Docker Client 与 Docker Daem ...

  10. webpack4.15.1 学习笔记(九) — 11个基础的插件使用

    目录 html-webpack-plugin clean-webpack-plugin webpack-manifest-plugin HotModuleReplacementPlugin(内置) m ...