Hbase系列文章 HBase(一): c#访问hbase组件开发 HBase(二): c#访问HBase之股票行情Demo HBase(三): Azure HDInsigt HBase表数据导入本地HBase 基于HDInsight 3.4 HBase集群规划参考 hadoop(四): 本地 hbase 集群配置 Azure Blob Storage HBase(五): HBase运维管理 HBase(六): HBase体系结构剖析(上) HBase(七): HBase体系结构剖析(下) HB…
一.简述 在使用 HBase 时,如果你的数据量达到了数十亿行或数百万列,此时能否在查询中返回大量数据将受制于网络的带宽,即便网络状况允许,但是客户端的计算处理也未必能够满足要求.在这种情况下,协处理器(Coprocessors)应运而生.它允许你将业务计算代码放入在 RegionServer 的协处理器中,将处理好的数据再返回给客户端,这可以极大地降低需要传输的数据量,从而获得性能上的提升.同时协处理器也允许用户扩展实现 HBase 目前所不具备的功能,如权限校验.二级索引.完整性约束等. 二…
一.概述 在上一篇博文中,我简要介绍了hbase的部分基础概念,如果想初步了解hbase的理论,可以参看上一篇博文 hbase系列之:初识hbase .本博文主要介绍独立模式下部署hbase及hbase的几个基本操作,需要具备一定的Linux基础. 二.部署前准备 1.纯净的Linux系统,本文使用CentOS7.5,IP地址为:192.168.200.31. 2.安装jdk并配置环境变量,本文使用jdk1.8.参看下文“java对hbase的版本支持”小节的内容. 3.新建hbase用户,并设…
一.概述 在hadoop生态圈里,hbase可谓是鼎鼎大名.江湖传言,hbase可以实现数十亿行X数百万列的实时查询,可横向扩展存储空间.如果传言为真,那得好好了解了解hbase.本文从概念上介绍hbase,稍微有点抽象,但这是学习hbase必须要了解的基础理论:如果想直接了解hbase的实操内容,可跳过本博文. 二.hbase介绍 先看看hbase官方的介绍:hbase是hadoop数据库,是一个分布式的,可扩展的大数据存储库:当需要对大数据进行随机,实时读/写访问时,可以使用hbase数据库…
HBase 系列(三)HBase Shell ./hbase shell # 进入 hbase 命令行 (1) HBase 命令帮助 help # 查看 HBase 所有的命令 create # 或 help 'create' 查看 create 的帮助命令 list # 查看 HBase 所有的表 (2) 名称空间,类似 mysql 中的数据库 list_namespace # 列出所有的数据库 create_namespace 'ns1' # 列出所有的数据库 list_namespace_…
HBase 系列(二)安装部署 本节以 Hadoop-2.7.6,HBase-1.4.5 为例安装 HBase 环境.HBase 也有三种模式:本地模式.伪分布模式.分布模式. 一.环境准备 (1) HBase 下载 HBase 下载地址:http://archive.apache.org/dist/hbase/ (2) SSH 服务 service sshd status 参考:http://www.cnblogs.com/binarylei/p/9049149.html (3) 域名系统 D…
Hbase 系列(一)基本概念 HBase 是 Apache 旗下一个高可靠性.高性能.面向列.可伸缩的分布式存储系统.利用 HBase 技术可在廉价 PC 服务器上搭建起大规模的存储化集群.使用 HBase 可以对数十亿级别的大数据进行实时性的高性能读写,在满足高性能的同时还保证了数据存取的原子性. 一.HBase 基本概念 大数据具有以下特征:volume(体量大).variety(样式多).velocity(速度快).valueless(价值密度低) Hbase(Hadoop Databa…
一.基本概念 一个典型的 Hbase Table 表如下: 1.1 Row Key (行键) Row Key 是用来检索记录的主键.想要访问 HBase Table 中的数据,只有以下三种方式: 通过指定的 Row Key 进行访问: 通过 Row Key 的 range 进行访问,即访问指定范围内的行: 进行全表扫描. Row Key 可以是任意字符串,存储时数据按照 Row Key 的字典序进行排序.这里需要注意以下两点: 因为字典序对 Int 排序的结果是 1,10,100,11,12,1…
一.基本命令 打开 Hbase Shell: # hbase shell 1.1 获取帮助 # 获取帮助 help # 获取命令的详细信息 help 'status' 1.2 查看服务器状态 status 1.3 查看版本信息 version 二.关于表的操作 2.1 查看所有表 list 2.2 创建表 命令格式: create '表名称', '列族名称 1','列族名称 2','列名称 N' # 创建一张名为Student的表,包含基本信息(baseInfo).学校信息(schoolInfo…
一.HBase过滤器简介 Hbase 提供了种类丰富的过滤器(filter)来提高数据处理的效率,用户可以通过内置或自定义的过滤器来对数据进行过滤,所有的过滤器都在服务端生效,即谓词下推(predicate push down).这样可以保证过滤掉的数据不会被传送到客户端,从而减轻网络传输和客户端处理的压力. 二.过滤器基础 2.1 Filter接口和FilterBase抽象类 Filter 接口中定义了过滤器的基本方法,FilterBase 抽象类实现了 Filter 接口.所有内置的过滤器则…