关于LSM树 LSM树,即日志结构合并树(Log-Structured Merge-Tree).其实它并不属于一个具体的数据结构,它更多是一种数据结构的设计思想.大多NoSQL数据库核心思想都是基于LSM来做的,只是具体的实现不同.所以本来不打算列入该系列,但是有朋友留言了好几次让我讲LSM树,那么就说一下LSM树. LSM树诞生背景 传统关系型数据库使用btree或一些变体作为存储结构,能高效进行查找.但保存在磁盘中时它也有一个明显的缺陷,那就是逻辑上相离很近但物理却可能相隔很远,这就可能造成…
<看图轻松理解数据结构和算法>,主要使用图片来描述常见的数据结构和算法,轻松阅读并理解掌握.本系列包括各种堆.各种队列.各种列表.各种树.各种图.各种排序等等几十篇的样子. 关于LSM树 LSM树,即日志结构合并树(Log-Structured Merge-Tree).其实它并不属于一个具体的数据结构,它更多是一种数据结构的设计思想.大多NoSQL数据库核心思想都是基于LSM来做的,只是具体的实现不同.所以本来不打算列入该系列,但是有朋友留言了好几次让我讲LSM树,那么就说一下LSM树. LS…
B树 B树即平衡查找树,一般理解为平衡多路查找树,也称为B-树.B_树.是一种自平衡树状数据结构,能对存储的数据进行O(log n)的时间复杂度进行查找.插入和删除.B树一般较多用在存储系统上,比如数据库或文件系统. B树特点 B树可以定义一个m值作为预定范围,即m路(阶)B树. 每个节点最多有m个孩子. 每个节点至少有ceil(m/2)个孩子,除了根节点和叶子节点外. 对于根节点,子树个数范围为[2,m],节点内值的个数范围为[1,m-1]. 对于非根节点,节点内的值个数范围为[ceil(m/…
AVL树 AVL树,也称平衡二叉搜索树,AVL是其发明者姓名简写.AVL树属于树的一种,而且它也是一棵二叉搜索树,不同的是他通过一定机制能保证二叉搜索树的平衡,平衡的二叉搜索树的查询效率更高. AVL树特点 AVL树是一棵二叉搜索树. AVL树的左右子节点也是AVL树. AVL树拥有二叉搜索树的所有基本特点. 每个节点的左右子节点的高度之差的绝对值最多为1,即平衡因子为范围为[-1,1]. 图中红色数字表示对应节点的高度,可以看到同一层的节点高度差都没有超过1. 二叉搜索树的平衡 基础的二叉搜索…
Radix树 Radix树,即基数树,也称压缩前缀树,是一种提供key-value存储查找的数据结构.与Trie不同的是,它对Trie树进行了空间优化,只有一个子节点的中间节点将被压缩.同样的,Radix树的插入.查询.删除操作的时间复杂度都为O(k). Radix树特点 一般由根节点.中间节点和叶子节点组成. 每个节点可以包含一个或多个字符. 树的叶子结点数即是数据条目数. 从根节点到某一节点经过路径的字符连起来即为该节点对应的字符串. 每个节点的所有子节点字符串都不相同. 插入操作 对rom…
Trie树 Trie树,是一种搜索树,也称字典树或单词查找树,此外也称前缀树,因为某节点的后代存在共同的前缀.它的key都为字符串,能做到高效查询和插入,时间复杂度为O(k),k为字符串长度,缺点是如果大量字符串没有共同前缀时很耗内存.它的核心思想就是减少没必要的字符比较,使查询高效率,即用空间换时间,再利用共同前缀来提高查询效率. Trie树特点 根节点不包含字符,其他节点每个节点只包含一个字符. 从根节点到某一节点经过路径的字符连起来即为该节点对应的字符串. 每个节点的所有子节点字符都不相同…
删除操作 删除操作比较复杂,主要是因为删除的项可能在叶子节点上也可能在非叶子节点上,而且删除后可能导致不符合B树的规定,这里暂且称之为导致B树不平衡,于是要进行一些合并.左旋.右旋等操作,使之符合B树的规定(即让B树平衡).另外,如果是删除非叶子节点项需要先找到中序前驱来替换. 情况一 要删除的项在叶子节点上且不影响B树的平衡结构,比如删除“I”,从根节点开始查找,“I”大于“D”,往第二个分支, 逐一与节点内项的值进行比较,“I”大于“F”,继续比较,“I”大于“H”继续比较,“I”小于“K”…
B+树 B+树是B树的一种变体,也属于平衡多路查找树,大体结构与B树相同,包含根节点.内部节点和叶子节点.多用于数据库和操作系统的文件系统中,由于B+树内部节点不保存数据,所以能在内存中存放更多索引,增加缓存命中率.另外因为叶子节点相连遍历操作很方便,而且数据也具有顺序性,便于区间查找. B+树特点 B+树可以定义一个m值作为预定范围,即m路(阶)B+树. 根节点可能是叶子节点,也可能是包含两个或两个以上子节点的节点. 内部节点如果拥有k个关键字则有k+1个子节点. 非叶子节点不保存数据,只保存…
数据结构与算法系列2 线性表 使用java实现动态数组+ArrayList源码详解 对数组有不了解的可以先看看我的另一篇文章,那篇文章对数组有很多详细的解析,而本篇文章则着重讲动态数组,另一篇文章链接如下,可点击跳转: 链接:https://blog.csdn.net/pjh88/article/details/107166950 什么是数组与动态数组? 数组 数组是相同数据类型的元素按照一定的顺序排列的集合,若将有限个类型相同的变量的集合命名,那么这个名称称为数组名,组成数组的各个变量称为数组…
栈(Stack)是限定仅在表尾进行插入或删除操作的线性表.表尾为栈顶(top),表头为栈底(bottom),不含元素的空表为空栈. 栈又称为后进先出(last in first out)的线性表. 堆栈可以用链表和数组两种方式实现,一般为一个堆栈预先分配一个大小固定且较合适的空间并非难事,所以较流行的做法是 Stack 结构下含一个数组.如果空间实在紧张,也可用链表实现,且去掉表头. 栈的链式表示结构图: 用js数组可以非常简单地实现栈的顺序表示,故这里不赘述.这里主要讲解一下栈的链式表示. /…