数据结构与算法之美学习笔记：B+树（第48讲）

一、解决问题的前提是定义清楚问题

通过对一些模糊需求进行假设，来限定要解决问题的范围

根据某个值查找数据，比如 select * from use where id=1234；
根据区间值来查询某些数据比如 select * from use where id > 1234 and id < 2345

性能方面的需求，我们主要考察时间和空间两方面，也就是执行效率和存储空间

执行效率：我么你希望通过索引，查询数据的效率尽可能的高；
存储空间方面：我们希望索引不需要消耗太多的内存空间

二、尝试用学过的数据结构解决这个问题

支持快速查询、插入等操作的动态数据结构，我们已经学过散列表、平衡二叉树、跳表

这样看来，跳表是可以解决这个问题，实际上，数据库索引所用到的数据结构跟跳表非常相似，叫做B+树
它是通过跳表演化雇来的，而非跳表

三、改造二叉查找树来解决这个问题

1、实现代码

/**

 * 这是 B+ 树非叶子节点的定义。

 *

 * 假设 keywords=[3, 5, 8, 10]

 * 4 个键值将数据分为 5 个区间：(-INF,3), [3,5), [5,8), [8,10), [10,INF)

 * 5 个区间分别对应：children[0]...children[4]

 *

 * m 值是事先计算得到的，计算的依据是让所有信息的大小正好等于页的大小：

 * PAGE_SIZE = (m-1)*4[keywordss 大小]+m*8[children 大小]

 */

public class BPlusTreeNode {

  public static int m = 5; // 5 叉树

  public int[] keywords = new int[m-1]; // 键值，用来划分数据区间

  public BPlusTreeNode[] children = new BPlusTreeNode[m];// 保存子节点指针

}

/**

 * 这是 B+ 树中叶子节点的定义。

 *

 * B+ 树中的叶子节点跟内部结点是不一样的,

 * 叶子节点存储的是值，而非区间。

 * 这个定义里，每个叶子节点存储 3 个数据行的键值及地址信息。

 *

 * k 值是事先计算得到的，计算的依据是让所有信息的大小正好等于页的大小：

 * PAGE_SIZE = k*4[keyw.. 大小]+k*8[dataAd.. 大小]+8[prev 大小]+8[next 大小]

 */

public class BPlusTreeLeafNode {

  public static int k = 3;

  public int[] keywords = new int[k]; // 数据的键值

  public long[] dataAddress = new long[k]; // 数据地址

  public BPlusTreeLeafNode prev; // 这个结点在链表中的前驱结点

  public BPlusTreeLeafNode next; // 这个结点在链表中的后继结点

}

2、实现步骤

3、实现思路

分裂合并

4、删除操作的例子

四、总结引申

1、每个节点中子节点的个数不能超过m，也不能小于m/2
2、根节点的子节点个数不可超过m/2，这是一个例外
3、M叉树只存储索引，并不真正存储数据，这个有点类似跳表
4、通过链表将叶子阶段串联在一次，这样可以方便区间查询
5、一般情况下，根节点会被存储在内存中，其他节点存储在磁盘中

数据结构与算法之美学习笔记：B+树（第48讲）的更多相关文章

【数据结构与算法Python版学习笔记】树——利用二叉堆实现优先级队列
概念队列有一个重要的变体,叫作优先级队列. 和队列一样,优先级队列从头部移除元素,不过元素的逻辑顺序是由优先级决定的. 优先级最高的元素在最前,优先级最低的元素在最后. 实现优先级队列的经典方法是使 ...
【数据结构与算法Python版学习笔记】树——二叉树的应用:解析树
解析树(语法树) 将树用于表示语言中句子, 可以分析句子的各种语法成分, 对句子的各种成分进行处理语法分析树程序设计语言的编译词法.语法检查从语法树生成目标代码自然语言处理机器翻译语义理 ...
【数据结构与算法Python版学习笔记】树——相关术语、定义、实现方法
概念一种基本的"非线性"数据结构--树根枝叶广泛应用于计算机科学的多个领域操作系统图形学数据库计算机网络特征第一个属性是层次性,即树是按层级构建的,越笼统就越 ...
【数据结构与算法Python版学习笔记】树——平衡二叉搜索树（AVL树）
定义能够在key插入时一直保持平衡的二叉查找树: AVL树利用AVL树实现ADT Map, 基本上与BST的实现相同,不同之处仅在于二叉树的生成与维护过程平衡因子 AVL树的实现中, 需要对每个 ...
【数据结构与算法Python版学习笔记】树——二叉查找树 Binary Search Tree
二叉搜索树,它是映射的另一种实现映射抽象数据类型前面两种实现,它们分别是列表二分搜索和散列表. 操作 Map()新建一个空的映射. put(key, val)往映射中加入一个新的键-值对.如果键已经 ...
【数据结构与算法Python版学习笔记】树——树的遍历 Tree Traversals
遍历方式前序遍历在前序遍历中,先访问根节点,然后递归地前序遍历左子树,最后递归地前序遍历右子树. 中序遍历在中序遍历中,先递归地中序遍历左子树,然后访问根节点,最后递归地中序遍历右子树. 后序遍 ...
数据结构与算法C++描述学习笔记1、辗转相除——欧几里得算法
前面学了一个星期的C++,以前阅读C++代码有些困难,现在好一些了.做了一些NOI的题目,这也是一个长期的目标中的一环.做到动态规划的相关题目时发现很多问题思考不通透,所以开始系统学习.学习的第一本是 ...
【数据结构与算法Python版学习笔记】引言
学习来源北京大学-数据结构与算法Python版目标了解计算机科学.程序设计和问题解决的基本概念计算机科学是对问题本身.问题的解决.以及问题求解过程中得出的解决方案的研究.面对一个特定问题,计 ...
【数据结构与算法Python版学习笔记】查找与排序——散列、散列函数、区块链
散列 Hasing 前言如果数据项之间是按照大小排好序的话,就可以利用二分查找来降低算法复杂度. 现在我们进一步来构造一个新的数据结构, 能使得查找算法的复杂度降到O(1), 这种概念称为" ...

随机推荐

findlibrary returned null
转载请标明出处,维权必究:https://www.cnblogs.com/tangZH/p/10181330.html 该错误是在加载so库的时候出现的,就是找不到so库. 一.检查jinLibs目录 ...
Win7环境搭建IIS环境。发布asp.net MVC项目到IIS（第一期）
一.右键添加网站,输入网站基本配置信息. 二.成功添加网站后,应用程序池里会多一个应用,版本一定要改成4.0,并且模式是集成模式,否则项目报错(原因可以看配置文件中的版本信息). 三.再启用项目时可能 ...
Python之Scripy框架
为什么要用到cmd界面 --- 在这里操作的是Scripy框架的指令,不是Python代码 Parse --- Scripy的回调函数 fiddler --- 用于爬取JS存储数据的页面项目: 1. ...
使用Navicat快速生成MySQL数据字典
1.通过information_schema.COLUMNS表查询该表可得到所需字段信息 SELECT * FROM information_schema.COLUMNS; 如下图所示: 2.示例 ...
浏览器仿EXCEL表格插件 - 智表ZCELL产品V1.4发布
智表(zcell)是一款浏览器仿excel表格jquery插件.智表可以为你提供excel般的智能体验,支持双击编辑.设置公式.设置显示小数精度.下拉框.自定义单元格.复制粘贴.不连续选定.合并单元格 ...
python一直放弃到双数的day10
今天接着来说那个新的大知识点,函数,函数中是可以传递一个数值的,这个数值简称为参数,对于参数,他可以是任意个数和任意类型(数据类型).参数的其中一种有位置传参,函数中的参数有几个,那么就要传入几个,传 ...
AI和机器学习对云应用的安全产生了何种影响？
AI和机器学习对云应用的安全产生了何种影响? 正如其他许多新兴技术一样,AI是一把双刃剑,它对于云计算的安全影响是双重的:这项技术可以使工作负载变得更加安全,但也可能会为新的威胁打开大门. 出现这种分 ...
一款回到顶部的 jQuery 插件，支持 Div 中的滚动条回到顶部
前言今天在网上搜索“回到顶部”的 jQuery 插件,网上有很多,但是大部分都不支持让 Div 中的滚动条回到顶部.于是乎,不放弃,自己参考 Github 上的一个 jQuery 插件,经过自己的修 ...
ASP.NET Core 2.1与2.2 SignalR CORS 跨域问题
将 SignalR 集成到 ASP.NET Core api 程序的时候,按照官方 DEMO 配置完成,本地访问没有问题,但是发布之后一直报跨域问题,本地是这样设置的: Asp.net core 2. ...
Redis进阶之使用Lua脚本开发
1.在Redis中使用Lua 在Redis中执行Lua脚本有两种方法:eval和evalsha. (1)eval eval 脚本内容 key个数 key列表参数列表下面例子使用了key列表和参数列 ...