HBase 索引创建
本文参考了文“mysql索引背后的数据结构及算法原理”,之所以还要摘录,主要是为了形成hbase索引研究的开篇,弄明白什么索引的本质,如有版权问题,请及时通知。
索引的本质
索引是帮助mysql高效获取数据的数据结构。索引属于数据结构的一种。
在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法。这个数据结构就是索引。
例子:
图1展示一种可能的索引。左边是数据,一共2列,共7条记录,最左边是数据记录的物理地址(逻辑上相邻的记录在磁盘上并不一定是物理相邻的)。为了加快col2的查找,维护一共右边的二叉树,每个节点包含索引键值和一个指向数据库物理地址的指针,这样就可以运用二叉树在O(log2n)的复杂度内获取数据。
B-Tree和B+Tree
目前大部分数据库系统和文件系统都采用B-Tree或其变种B+Tree作为索引结构。
B-树定义:B-树是一种平衡的多路查找树。一颗m阶的B-树,或为空树,或为满足下列特征的m叉树:
⑴每个节点最多有m棵子树;
⑵若跟节点不是叶子节点,则至少有2棵子树;
⑶除跟之外的所有非终端节点至少有[m/2]棵子树;
⑷所有非重点节点包含以下信息:(n,K1,A1,K…,Kn,An)其中:
Ki(i=1,…,n)为关键字,且Ki<Ki+1
Ai(1=1,…,n)为指向子树跟节点的指针,且Ai-1所指示子树中所有节点的关键字的值都小于Ki,Ai所指示子树所有节点的关键字的值都大于Ki
⑸所有的叶子节点都出现在同一层上
如:(m=3)的B-树
B-树索引,从根节点开始,对节点内关键字进行二份查找,如果命中,则结束,否则进入查找关键字所属范围的儿子节点,重复,知道对应的儿子节点指针为空或已经是叶子节点。
B-树特征:
⑴关键字集合分布在整棵树中;
⑵任何关键字出现且只出现在一个节点中;
B+树:B-树的一种变型树,它与B-树的差异在于:
⑴有n棵子树的结点含有n个关键字;
⑵所有的叶子节点包含全部关键字信息,及指向这些关键字的指针,且叶子节点之间是自小而大顺序链接;
⑶所有非叶子节点仅包含其子树最大(或最小)关键字。
通常B+树有2个头指针,一个指向头指针,一个指向关键字最小的叶子节点。下图为一个B+树的示例图:
B+树索引,在查找时,若非叶子节点的关键字等于给定值,并不终止,而是继续向下,直至叶子节点。
一般来说,索引本身也很大,不可能全部存储在内存中,因此索引往往以索引文件的形式存在磁盘上,索引查找过程中就要产生磁盘I/O操作,因此索引要尽量减少查找过程的I/O存取次数。
主存存储原理
目前计算机的主存基本都是随机读取存储器(RAM),下图展现了一个主存模型:
主存是一系列的存储单元组成的矩阵,每个存储单元存储固定大小的数据。每个存储单元有唯一的地址,通过行地址和列地址可以唯一定位一个存储单元。当系统需要读取主存时,则将地址信号放在地址总线上传给主存,主存读到地址信号,解析信号并定位到制定的存储单元,然后将此存储单元上数据放在数据总线上,供其他部件读取。写主存类似,系统将要写入的地址和数据分别放在地址总线和数据总线上,主存读取2个总线的内容,做相应的写操作。
磁盘存取原理
索引检索需要磁盘IO,磁盘IO存在机械运动耗费,因此磁盘IO的时间消耗是巨大的:
一个磁盘由大小相同且同轴的圆盘组成,圆盘可以转动。在磁盘的一侧有磁头支架,磁头支架固定一组磁头,每个磁头负责存取一个磁盘的内容,磁头不能运动,但可以沿半径方向运动。
磁盘被划分为一系列同心环,圆心是磁盘的中心每个同心环叫做一个磁道;磁道被沿半径划分为一个个小的段,叫扇区。每个扇区是磁盘的最小存储单位。
Mysql索引实现
1、MyISAM索引实现
MyISAM引擎使用B+树作为索引结构,叶子节点的data域存放的是数据记录的地址,如下:
数据库记录存在磁盘的一块地方,索引指示数据库每条记录的存放地址,从索引查询到地址后,直接从该处读取就可以获得数据。此类型索引,主索引和辅助索引在结构上并没有任何区别,指示主索引要求key是唯一的,而辅助索引key可以是重复的。
2、InnoDB索引实现
InnoDB也使用B+tree作为索引结构。但是⑴节点位置存放的不是数据地址,而是记录值,如下:
上图中叶子节点中包含完整的数据记录。
⑵辅助索引的data域存放的是主键位置而不是地址,如下:
这种索引使得按主键的搜索十分高效,但辅助索引的搜索需要2遍索引。
转自:http://smurfs.iteye.com/blog/1299976
HBase 索引创建的更多相关文章
- 通过phoenix在hbase上创建二级索引,Secondary Indexing
环境描述: 操作系统版本:CentOS release 6.5 (Final) 内核版本:2.6.32-431.el6.x86_64 phoenix版本:phoenix-4.10.0 hbase版本: ...
- mysql 优化实例之索引创建
mysql 优化实例之索引创建 优化前: pt-query-degist分析结果: # Query 23: 0.00 QPS, 0.00x concurrency, ID 0x78761E301CC7 ...
- MongoDB索引创建(5)
索引创建 1:索引提高查询速度,降低写入速度,权衡常用的查询字段,不必在太多列上建索引 2. 在mongodb中,索引可以按字段升序/降序来创建,便于排序 3. 默认是用btree来组织索引文件,2. ...
- Lucene7.1.0版本的索引创建与查询以及维护,包括新版本的一些新特性探索!
一 吐槽 lucene版本更新实在太快了,往往旧版本都还没学会,新的就出来,而且每个版本改动都特别大,尤其是4.7,6,6,7.1.......ε=(´ο`*)))唉,但不可否认,新版本确实要比旧版本 ...
- 3.1-3.3 HBase Shell创建表
一.HBase Shell创建表 1.HBASE shell命令 ## hbase(main):001:0> create_namespace 'ns1' //创建命名空间:ns1 hbase( ...
- 索引-mysql索引创建、查看、删除及使用示例
mysql索引创建.查看.删除及使用示例 1.创建索引: ALTER TABLE用来创建普通索引.UNIQUE索引或PRIMARY KEY索引. ALTER TABLE table_name ADD ...
- solr索引创建流程
solr索引创建流程: 分词组件Tokenizer 分词组件(Tokenizer)会做以下几件事情(这个过程称为:Tokenize),处理得到的结果是词汇单元(Token). 1.将文档分成一个一个单 ...
- SQL Server获取索引创建时间&重建时间&重组时间
之前写过一篇博客"SQL Server中是否可以准确获取最后一次索引重建的时间?",里面主要讲述了三个问题:我们能否找到索引的创建时间?最后一次索引重建(Index Rebuild ...
- substr函数索引创建测试
技术群里小伙伴,沟通说一条经常查询的SQL缓慢,单表SQL一个列作为条件,列是int数值类型,索引类型默认创建. 一.SQL文本substr函数索引创建测试 ,) nm1 ')需求,将上述SQL执行速 ...
随机推荐
- SQL 数据库语言分析总结(二)
介绍sql语言 我们接着一的顺序继续介绍这个语言 数据类型 整形: TINYINT(8位) SMALLINT(16位) MEDIUMINT(24位) INT(32位) BIGINT(64位) 实数: ...
- 后端分布式系列:分布式存储-MySQL 数据库事务与复制
好久没有写技术文章了,因为一直在思考 「后端分布式」这个系列到底怎么写才合适.最近基本想清楚了,「后端分布式」包括「分布式存储」和 「分布式计算」两大类.结合实际工作中碰到的问题,以寻找答案的方式来剖 ...
- 如何解决RK3168或者RK系列MASKROM的问题
不知道使用RK芯片的小伙伴有没有遇到我这样的问题,在用Android-Tool下载相应 IMG的时候,正常情况下,按电源键和音量+键应该出现loader下载模式,但是却出现MASKROM的字样,以前不 ...
- 统计git代码提交量
以下是我写的一个脚本,可以统计在某个项目中,自己修改代码的行数,包括增加多少行,删除多少行. 可以统计当天,24小时内或全部时间内.使用时需要把代码中的author对应的值换成自己的名字. 代码如下: ...
- 【Unity技巧】制作一个简单的NPC
1. 写在前面 前几天看了cgcookie的一个教程,学习了下怎么根据已有人物模型制作一个仿版的NPC人物,感觉挺好玩的,整理一下放到博客里! 先看一下教程里面的最终效果. 是不是很像个幽灵~ 下面是 ...
- 【Unity Shaders】Reflecting Your World —— Unity3D中的法线贴图和反射
本系列主要参考<Unity Shaders and Effects Cookbook>一书(感谢原书作者),同时会加上一点个人理解或拓展. 这里是本书所有的插图.这里是本书所需的代码和资源 ...
- (NO.00003)iOS游戏简单的机器人投射游戏成形记(二十)
接上一篇文章,我们现在来实现篮框的感应器. 所谓感应器,就是在物体接触到的时候做出反应的节点.我们需要将感应器放在篮框底部,这样子弹接触感应器的时候,我们就知道子弹坠入了篮框,从而得分. 为了放置子弹 ...
- React Native控件之Listview
ListView组件用于显示一个垂直的滚动列表,其中的元素之间结构近似而仅数据不同. ListView更适于长列表数据,且元素个数可以增删.和ScrollView不同的是,ListView并不立即渲染 ...
- 【翻译】从Store生成Checkbox Group
原文:Ext JS: Generating a Checkbox Group from a Store Ext JS的checkbox group可以用来将复选框组合成一个单一的逻辑字段.由于复选框时 ...
- android自定义组件的简易实现
写这篇博客是为了复习之前在慕课上面有幸看到的自定义组件的实现,原理很简单,有三个步骤, 为自定义的组件做好声明:封装成具体的可以使用的组件类,并利用接口回调机制为其注册监听函数:想使用正常的组件的方式 ...