085 HBase的二级索引，以及phoenix的安装（需再做一次）

一：问题由来

1.举例

　　有A列与B列，分别是年龄与姓名。

　　如果想通过年龄查询姓名。

　　正常的检索是通过rowkey进行检索。

　　　　根据年龄查询rowkey，然后根据rowkey进行查找姓名。

　　　　这样的效率不高，因为要两次scan。

2.建议有一张索引表。

二：HBase的二级索引

1.讲解

　　rowkey是uid+ts
　　　　11111_20161126111111:

　　　　这个rowkey方便查询某一uid的某一个时间段内的数据

　　问题：
　　　　查询某一时间段内所有用户的数据：按照时间

　　索引表

　　　rowkey：ts+uid 20161126111111—111111

　　　其他列：info:uid

　　　值是uid+ts，因为这个是原表的rowkey。

　　检索流程：

　　　　从索引表中根据时间段来查询源表rowkey
　　　　根据rowkey来查询源表

2.还有的问题

　　如何保持索引表与原表的同步问题。

　　好的方式是：编写协处理器，将客户端实现的逻辑代码放到服务端。

　　同时，可以使用其他的框架，主要有solr，phoenix。elassearch。

3.协处理器

　　observer处理器：观察者，类似于触发器

　　endpoint类：终端类，类似于储存过程。

4.hbase自带的协处理器

　　这个在hbase：meta中

　　可以通过desc 'hbase:meta'进行查看

　　是coprocessor$1。

三：phoenix的安装

1.上传源码包

　　因为对应的hbase0.98.6没有对应的phoenix，所以需要自己进行编译。

2.解压到modules文件夹下

　　tar -zxvf phoenix-4.2.2-src.tar.gz -C /etc/opt/modules/

3.修改pom.xml文件

　　有一个问题，将所有的hadoop-two.version 变量都换成2.5.0

　　<hbase.version>0.98.6-hadoop2</hbase.version>
　　<hadoop-two.version>2.5.0</hadoop-two.version>

4.进入主目录

5.编译

　　mvn clean package -DskipTests

　　----------------------------------------------------（以下需要重新编译，重新做）------------------------------------------------------------

6.查找编译好的包

　　Phoenix_home/Phoenix-assembly/target/phoenix-4.2.2.tar.gz

7.安装phoenix

　　启动的时候，后面跟的是zookeeper地址。

8.phoenix映射原有的表

　　执行的语句，在phoenix中。

　　hbase对于大小写敏感，然后需要将phoenix中的语句进行双引号引起来。

9.看效果

　　可以在phoenix中查询映射的表。

　　select * from "s1";

　　将会发现，这里的数据与hbase中的数据相同。

085 HBase的二级索引，以及phoenix的安装（需再做一次）的更多相关文章

HBase的二级索引，以及phoenix的安装（需再做一次）
一:HBase的二级索引 1.讲解 uid+ts 11111_20161126111111:查询某一uid的某一个时间段内的数据查询某一时间段内所有用户的数据:按照时间索引表 rowkey:ts+ ...
HBase建立二级索引的一些解决方式
HBase的一级索引就是rowkey,我们仅仅能通过rowkey进行检索. 假设我们相对hbase里面列族的列列进行一些组合查询.就须要採用HBase的二级索引方案来进行多条件的查询. 常见的二级索引 ...
HBase之八--(2)：HBase二级索引之Phoenix
1. 介绍 Phoenix 是 Salesforce.com 开源的一个 Java 中间件,可以让开发者在Apache HBase 上执行 SQL 查询.Phoenix完全使用Java编写,代码位于 ...
利用Phoenix为HBase创建二级索引
为什么需要Secondary Index 对于Hbase而言,如果想精确地定位到某行记录,唯一的办法是通过rowkey来查询.如果不通过rowkey来查找数据,就必须逐行地比较每一列的值,即全表扫瞄. ...
hbase构建二级索引解决方案
关注公众号:大数据技术派,回复"资料",领取1024G资料. 1 为什么需要二级索引 HBase的一级索引就是rowkey,我们仅仅能通过rowkey进行检索.假设我们相对Hbas ...
基于Solr实现HBase的二级索引
文章来源:http://www.open-open.com/lib/view/open1421501717312.html 实现目的: 由于hbase基于行健有序存储,在查询时使用行健十分高效,然后想 ...
hbase coprocessor 二级索引
Coprocessor方式二级索引 1. Coprocessor提供了一种机制可以让开发者直接在RegionServer上运行自定义代码来管理数据.通常我们使用get或者scan来从Hbase中获取数 ...
[How to] MapReduce on HBase ----- 简单二级索引的实现
1.简介 MapReduce计算框架是二代hadoop的YARN一部分,能够提供大数据量的平行批处理.MR只提供了基本的计算方法,之所以能够使用在不用的数据格式上包括HBase表上是因为特定格式上的数 ...
HBase的二级索引
使用HBase存储中国好声音数据的案例,业务描述如下: 为了能高效的查询到我们需要的数据,我们在RowKey的设计上下了不少功夫,因为过滤RowKey或者根据RowKey查询数据的效率是最高的,我们的 ...

随机推荐

pyqt5-布局控件
在布局中添加控件用addWidght(),添加布局用addLayout() 垂直布局QVBoxLayout 需要导入 from PyQt5.QtWidgets import QVBoxLayout ...
vue插件开发实践与要点
其实就跟组件差不多意思,组件也可以实现相关的效果,但要在用到的地方都引用插件就可以全局注册,不需引用试着撸一个插件,有2个功能,提示和对话框网上找了个toast插件的代码,改了改,扩展加了个dia ...
关于《汇编语言（王爽）》程序6.3使用16个dw 0的问题
在学习王爽老师<汇编语言>的第6.2节时,在程序6.3代码中,给出了如下的代码: assume cs:code code segment dw 0123h, 0456h, 0789h, 0 ...
FPN-Feature Pyramid Networks for Object Detection
FPN-Feature Pyramid Networks for Object Detection 标签(空格分隔): 深度学习目标检测这次学习的论文是FPN,是关于解决多尺度问题的一篇论文.记录 ...
android handlerThread
一.handlerThread产生的背景
C++学习5-面向对象编程基础（构造函数、转换构造、静态数据成员、静态成员函数、友元）
知识点学习类 const作用 C语言的const限定符的含义为"一个不能改变值的变量",C++的const限定符的含义为"一个有类型描述的常量": const ...
argv[1] 路径问题
在看<学习opencv>一书时遇到一个小问题:函数只是通过argv传递参数来读取图片并显示,但是却一直弹出画布,没有图像. 如下:test.c # include<stdio.h&g ...
关于MySQL 8.0的几个重点【转】
转自关于MySQL .0的几个重点,都在这里 https://mp.weixin.qq.com/s/QUpk9uuS2JTli1GT6HuORA 一.关于MySQL Server的改进 1.1 re ...
Ajax jsonp 跨域请求实例
跨域请求 JSONP的缺点则是:它只支持GET请求而不支持POST等其它类型的HTTP请求:它只支持跨域HTTP请求这种情况,不能解决不同域的两个页面之间如何进行JavaScript调用的问题. $. ...
安装jdk的时候为什么会有两个jre文件
有些东西,你懂不懂其实并不太影响你干活,但有些人就是有疑惑就非得弄懂,不然浑身难受,我大概就是这种德性的.昨天安装javaSE的时候,看到jdk中有个jre文件夹,而根目录下又有个jre文件夹,非常困 ...

085 HBase的二级索引，以及phoenix的安装（需再做一次）

085 HBase的二级索引，以及phoenix的安装（需再做一次）的更多相关文章

随机推荐

热门专题