笔试算法题（58）：二分查找树性能分析（Binary Search Tree Performance Analysis）

议题：二分查找树性能分析（Binary Search Tree Performance Analysis）

分析：

二叉搜索树（Binary Search Tree，BST）是一颗典型的二叉树，同时任何节点的键值大于等于该节点左子树中的所有键值，小于等于该节点右子树中的所有键值，并且每个节点域中保存一个记录以其为根节点的子树中所有节点个数的属性，这个属性可用于支持贪婪算法的实现；
二叉搜索树的建立是在树的底部添加新的元素，搜索即从根元素开始到达树底部的一条路径，插入和搜索相似（注意对重复键的处理），排序按照节点访问方式不同有前序、中序、后序三种；
二叉搜索树算法的运行时间取决于树的形状，最好情况下根节点与每个外部节点间有㏒N个节点，此时树完全平衡，最坏情况下搜索路径上有N个节点。由于创建二叉搜索树的时候，第一个插入的元素总是作为根元素，所以元素插入的顺序决定树的形状。在随机情况下，极度平衡和极度不平衡的树都很少出现，所以这种情况下二叉搜索树算法有着良好的运行情况；
所以平均情况下，N个随机生成的BST树种，一次搜索，插入大约需要1.39㏒N此比较。如果键值不是随机出现，则二叉搜索树退化为N个节点的链表，一次操作为线性O(N)运行时间；
使用BST树存储文件中每一个文本串，基于字符串的排序使得搜索变得容易；
BottomUp插入策略：按照前序策略遍历整个树结构，首先查看当前节点是否为NULL，然后与关键值比较查看是否为目标值，不是的话就分别针对左右子树递归调用搜索算法，然后进入下一个结构，注意在递归调用之间的衔接是由返回一个节点来实现的，所以如果已经到达树底部，则返回一个新节点，这个节点正好位于上一级的子树连接上，这样正好形成整个树结构；
TopDown插入策略：在BottomUp插入策略的基础上，将新插入的节点在递归回溯的时候逐层旋转，知道根节点的位置；使用基于递归插入操作和旋转操作的策略可以使得最近插入的元素接近BST树的顶部，同时保持树的平衡性。这种插入方式称为从根部插入，实现策略：首先使用普通递归插入将在树底部找到一个合适的位置插入新的节点，然后使用旋转操作将这个新加入的节点旋转到根节点处，不仅可以保持树的平衡，而且由于最近插入的项被使用的概率大，靠近根节点则加速搜索效率；
旋转操作：BST树中从根部插入新节点：首要考虑的就是是否能够保持BST树的性质。现在使用基于旋转（Rotation）的转换策略，使得BST树保持原有性质。旋转实质上是交换根节点和一个孩子的角色，同时保持各节点的顺序
选择第Kth个值（最小或者最大）：利用Node节点中的count标记（此标记说明以当前节点为根节点的子树的所有节点数），可以快速查找给定的序列中第Kth个最小或者最大值；当然前提是将给定的序列扩建成BST；从根节点开始，首先检查其左子树中节点个数，如果正好为K个则返回根节点本身，如果大于 K个节点，则对左子树递归调用算法，如果小于K个节点，则说明第K个最小键在根节点的右子树中，变成查找右子树中第K-t-1个最小键的项（t为左子树所有节点，1为根节点自身）；
BST树的节点删除操作：被删除的节点可以有三种情况，没有子节点，有一个子节点，有两个子节点。第一种情况可直接删除；第二种情况需要临时存储子节点的索引，并让被删除节点的父节点指向这个这个索引；第三种情况需要维护BST树的性质，所以一般性策略是选择右子树中最小的元素作为新的根节点（右子树中最小的元素出现在最左边，所以它至多只有一个子节点，可容易删除），然而有时候也会选择左子树中的最大元素作为新的根节点（由于在左右子树中任意选择新的节点作为新的根节点，所以可能造成BST树的不平衡）；

样例：

 struct Node {

         int value;

         int count;

         Node *left;

         Node *right;

         Node(int v, int c=, Node* l=NULL, Node* r=NULL):

                                 count(c), value(v), left(l), right(r) {

         }

 };

 /**

  * 对root节点进行右旋转操作，也就是：

  * 1. 让root原来的左孩子变成newRoot；

  * 2. 让root变成newRoot的右子节点；

  * 3. 让root原来的左孩子的的右子节点变成root的左子节点

  * */

 Node* rightRotate(Node *root) {

         Node *newRoot=root->left;

         root->left=root->left->right;

         newRoot->right=root;

         return newRoot;

 }

 /**

  * 对root节点进行左旋转操作，也就是：

  * 1. 让root原来的右孩子变成newRoot；

  * 2. 让root变成newRoot的左子节点；

  * 3. 让root原来的右孩子的左子节点变成root的右子节点

  * */

 Node* leftRotate(Node *root) {

         Node *newRoot=root->right;

         root->right=root->right->left;

         newRoot->left=root;

         return newRoot;

 }

 Node* binaryTreeSearch(Node *root, int target) {

         if(root==NULL)

                 return NULL;

         if(target>root->value)

                 return binaryTreeSearch(root->right, target);

         else if(target<root->value)

                 return binaryTreeSearch(root->left, target);

         else

                 return root;

 }

 Node* binaryTreeInsert(Node *root, int target) {

         if(root==NULL) {

                 return new Node(target);

         }

         if(target>root->value)

                 root->right=binaryTreeInsert(root->right, target);

         else if(target<root->value)

                 root->left=binaryTreeInsert(root->left, target);

         return root;

 }

 /**

  * 这样可以将新插入的元素旋转到为root；

  * 不仅可以保持BST的平衡性，而且可以保证

  * 新插入的元素的最大访问延迟；

  * */

 Node* binaryTreeInsertTopDown(Node *root, int target) {

         if(root==NULL) {

                 return new Node(target);

         }

         if(target>root->value) {

                 root->right=binaryTreeInsert(root->right, target);

                 root=leftRotate(root);

         }

         else if(target<root->value) {

                 root->left=binaryTreeInsert(root->left, target);

                 root=rightRotate(root);

         }

         return root;

 }

 Node* binaryTreeInsertWithCount(Node *root, int target) {

         if(root==NULL) {

                 return new Node(target);

         }

         if(target>root->value)

                 root->right=binaryTreeInsert(root->right, target);

         else if(target<root->value)

                 root->left=binaryTreeInsert(root->left, target);

         root->count++;

         return root;

 }

 /**

  * 从一个序列中选定第K大的数字，

  * */

 int binaryTreeSelect(Node *root, int k) {

         /**

          * 如果当前root为NULL，则选择失败

          * */

         if(root==NULL) {

                 printf("\nfind nothing-_-\n");

                 return -;

         }

         /**

          * 如果root的左子节点为NULL

          * */

         if(root->left==NULL) {

                 if(k==)

                         return root->value;

                 return binaryTreeSelect(root->right, k-);

         }

         /**

          * 如果root的左子节点不为NULL；

          * 1. 如果K<=leftCount，则Kth个节点在左子树中

          * 2. 如果K==leftCount+1，则kth个节点就是root自身

          * 3. 如果k>leftCount+1，则Kth个节点就是右子树中的k-1-leftCount个节点

          * */

         int leftCount=root->left->count;

         if(leftCount>=k)

                 return binaryTreeSelect(root->left, k);

         else if(leftCount+==k)

                 return root->value;

         else

                 return binaryTreeSelect(root->right, k--leftCount);

 }

 /**

  * 将指定的元素target旋转到根节点

  * */

 Node* binaryTreeRotate(Node *root, int target) {

         if(root==NULL)

                 return NULL;

         if(target>root->value) {

                 root->right=binaryTreeRotate(root->right,target);

                 leftRotate(root);

         } else if(target<root->value) {

                 root->left=binaryTreeRotate(root->left,target);

                 rightRotate(root);

         }

         return root;

 }

 /**

  * 此方法寻找root的左子树中具有最大value的子节点，也就是最‘左边’的子节点；

  * */

 Node* subtreeRightMaximum(Node *root) {

         Node *cur=root;

         Node *pre;

         while(cur!=NULL) {

                 pre=cur;

                 cur=cur->left;

         }

         return pre;

 }

 /**

  * 此方法寻找root的右子树中具有最大value的子节点，也就是最‘左边’的子节点；

  * */

 Node* subTreeLeftMaximum(Node* root) {

         Node *cur=root;

         Node *pre;

         while(cur!=NULL) {

                 pre=cur;

                 cur=cur->right;

         }

         return pre;

 }

 Node* binaryTreeDelete(Node *root, int target) {

         if(root==NULL)

                 return NULL;

         Node *temp;

         Node *newRoot;

         /**

          * 如果target比root->value大，则说明其位于root的

          * 右子树，则继续递归

          * 如果target比root->value小，则说明其位于root的

          * 左子树，则继续递归

          * 如果target等于root->value，则说明当前节点root

          * 就是需要删除的节点，然后分三种情况讨论：

          * 1. 如果root没有左右子节点

          * 2. 如果root只有左节点或者只有右节点

          * 3. 如果root德尔左右子节点都存在；

          * */

         if(target>root->value)

                 root->right=binaryTreeDelete(root->right, target);

         else if(target<root->value)

                 root->left=binaryTreeDelete(root->left, target);

         else {

                 if(root->left==NULL && root->right) {

                         delete root;

                         return NULL;

                 } else if(root->left==NULL) {

                         temp=root->right;

                         delete root;

                         return temp;

                 } else if(root->right==NULL) {

                         temp=root->left;

                         delete root;

                         return temp;

                 }

                 /**

                  * 左右子节点都存在的情况，需要从左右子树中寻找下一个根节点；

                  * 这里是从右子树中选取最小的一个节点作为新的根节点；

                  * */

                 newRoot=subtreeRightMaximum(root->right);

                 /**

                  * 由于右子树中最小的节点必然至多只有一个右节点，所以其删除操作

                  * 较为简单；然后将其的左右子树替换成当前的左右子树；

                  * */

                 newRoot=binaryTreeDelete(root->right, newRoot->value);

                 newRoot->right=root->right;

                 newRoot->left=root->left;

                 delete root;

         }

 }

补充：

BST中搜索和插入的策略都是一样的，从传入的树节点开始，首先判断其是否为NULL，如果是的话对于搜索来讲表示失败，对于插入来讲表示需要插入新的节点；如果不是NULL的话，对于搜索来讲比对是否为目标值，然后针对左右子树递归调用，对于插入来讲比对是否相同，表示树中已经有同样的节点算法说明；
BST树的构建和搜索也使用同样的遍历策略，所以插入与搜索一样容易实现；旋转可用于防止树变得不平衡，实现删除，合并和其他操作的辅助操作，BST树的插入操作可以通过在树的底部插入新元素，然后使用左旋和右旋将新元素带到根节点处，防止树的不平衡状态。每次BST搜索命中的项也可以通过旋转带到根节点处；
使用BST树进行选择算法最大的缺点就是计数域的出现导致额外的内存占用，树结构改变时需要额外的维护操作，同时我们可以对查找到的节点元素使用旋转操作，将其放到根节点的位置，下次使用的时候就能很快定位；

BST树的性能特征总结：

二叉搜索树算法的运行时间取决于树的形状，最好情况下树可能完全平衡，这样一次搜索过程就是一条路径的长度㏒N，最差情况下树退化为链表，这样一次搜索过程路径长度可能为N；
使用插入操作构建BST树的过程中，越是前面的节点对树最终形状的影响越是大，第一个元素就是树根，对于随机序列来讲，最坏情况出现的概率很小，所以平均情况能保持较好的运行时间，㏒N；
使用索引项来表示搜索节点，避免动态分配内存。当序列以随机序列插入时，生成完全平衡树的概率很小，但二叉树路径的长度和树的高度与BST的搜索开销联系紧密。平均情况下一棵根据N个随机键生成的BST树中，搜索命中（插入和搜索失败）大约需要1.39㏒N次比较。最坏情况下，可能需要N此比较（也就是顺序搜索）；

笔试算法题（58）：二分查找树性能分析（Binary Search Tree Performance Analysis）的更多相关文章

LeetCode之“树”：Validate Binary Search Tree
题目链接题目要求: Given a binary tree, determine if it is a valid binary search tree (BST). Assume a BST is ...
[Swift]LeetCode270. 最近的二分搜索树的值 $ Closest Binary Search Tree Value
Given a non-empty binary search tree and a target value, find the value in the BST that is closest t ...
[刷题] 235 Lowest Common Ancestor of a Binary Search Tree
要求给定一棵二分搜索树和两个节点,寻找这两个节点的最近公共祖先示例 2和8的最近公共祖先是6 2和4的最近公共祖先是2 思路 p q<node node<p q p<=node& ...
【树】Validate Binary Search Tree
需要注意的是,左子树的所有节点都要比根节点小,而非只是其左孩子比其小,右子树同样.这是很容易出错的一点是,很多人往往只考虑了每个根节点比其左孩子大比其右孩子小.如下面非二分查找树,如果只比较节点和其左 ...
【leetcode刷题笔记】Convert Sorted List to Binary Search Tree
Given a singly linked list where elements are sorted in ascending order, convert it to a height bala ...
【leetcode刷题笔记】Convert Sorted Array to Binary Search Tree
Given an array where elements are sorted in ascending order, convert it to a height balanced BST. 题解 ...
第33题：LeetCode255 Verify Preorder Sequence in Binary Search Tree 验证先序遍历是否符合二叉搜索树
题目输入一个整数数组,判断该数组是不是某二叉搜索树的后序遍历的结果.如果是则输出Yes,否则输出No.假设输入的数组的任意两个数字都互不相同. 考点 1.BST 二叉搜索树 2.递归思路 1.后序 ...
算法与数据结构基础 - 二叉查找树(Binary Search Tree)
二叉查找树基础二叉查找树(BST)满足这样的性质,或是一颗空树:或左子树节点值小于根节点值.右子树节点值大于根节点值,左右子树也分别满足这个性质. 利用这个性质,可以迭代(iterative)或递归 ...
PAT题库-1064. Complete Binary Search Tree (30)
1064. Complete Binary Search Tree (30) 时间限制 100 ms 内存限制 32000 kB 代码长度限制 16000 B 判题程序 Standard 作者 CHE ...

随机推荐

三步升级已安装的 Android SDK 和 ADT 插件（转载）
转载:http://www.tfan.org/update-adt-and-android-sdk-in-five-minutes/ 如何快速地把已安装的 Android SDK 及 Eclipse ...
oauth X-Frame-Options 跳转授权页面时，302重定向禁用iframe
因为oauth/authorize响应头包含X-Frame-Options: DENY解决方案:openresty nginx 移除该属性,经测试生效 more_clear_headers X-Fra ...
通过爬虫爬取四川省公共资源交易平台上最近的招标信息 --- URLConnection
通过爬虫爬取公共资源交易平台(四川省)最近的招标信息一:引入JSON的相关的依赖 <dependency> <groupId>net.sf.json-lib< ...
python系列1_travel
Python__copy copy模块用于对象的拷贝操作.该模块只提供了两个主要的方法:copy.copy与copy.deepcopy,分别表示浅复制与深复制. 浅拷贝(copy):拷贝父对象,不会拷 ...
[USACO 2012 Jan Silver] Delivery Route【拆点】
传送门:http://www.usaco.org/index.php?page=viewproblem2&cpid=106 这道题还真是完全没思路,真的不知道怎么做,但是看了题解后恍然大悟. ...
转-AFNetwork 作用和用法详解
来自:http://www.maxiaoguo.com/clothes/269.html AFNetworking是一个轻量级的iOS网络通信类库.它建立在NSURLConnection和NSOper ...
转 oracle apex 使用
https://wenku.baidu.com/view/e5a4226955270722182ef725.html
APP多渠道打包
多渠道打包的概念: 打包是指使用证书文件对app签名生成一个apk文件. 多渠道打包指的就是我们的app在开发完成之后需要投放到不同的市场,比如说Google市场.百度市场等,为了统计应用在各个市场的 ...
[转]Business Model Canvas（商业模式画布）：创业公司做头脑风暴和可行性测试的一大利器
本文转自:http://www.36kr.com/p/214438.html 本文来自First Round Review,他们准备的文章既讲故事,还同时向创业者提供可操作的建议,以助力打造优秀的公司 ...
(四)SpringIoc之Bean装配
在pom.xml的依赖 <dependencies>  <dependency> <groupId>junit</groupI ...

笔试算法题（58）：二分查找树性能分析（Binary Search Tree Performance Analysis）

笔试算法题（58）：二分查找树性能分析（Binary Search Tree Performance Analysis）的更多相关文章

随机推荐

热门专题