----------------------------------------hbase的 安装----------------------------------------

本地安装:

1 解压文件夹。

2 修改  conf/hbase-site.xml ,配置 数据文件夹

   <property>

<name>hbase.rootdir</name>
<value>file:///DIRECTORY/hbase</value>
</property>
3 然后就可以启动了:./bin/start-hbase.sh 4 进入客户端:./bin/hbase shell 分布式安装:
1 修改 数据文件目录( habse-site.xml)
  hbase.rootdir
  2 开启分布式( habse-site.xml)
 hbase.cluster.distributed
3 配置regionserver (regionservers)

4 停用 自带的 zk ( hbase-en.sh)
  HBASE_MANAGES_ZK=false 5 配置 zk 集群地址,和 配置 只看数据文件地址( habse-site.xml)
  hbase.zookeeper.quorum
  hbase.zookeeper.property.dataDir 6 复制 hdfs-site.xml 到hbase的 配置文件目录。 7 启动 hbase
  ./bin/start-hbase.sh   备注:默认 只会在启动 hbase 的机器上启动一个 hmaster 。但是我们可以在别的 任意节点再次启动其他 hmaster。
8 启动别的 hmaster 
 ./hbase-daemon.sh start master

----------------------------------------hbase的常见语法----------------------------------------

1 创建表 :

  create 'test', 'cf'

2 插入一行: (一次只能插入一列,如果有多列 反复用这个rowkey 插入)

  put 'test', 'row1', 'cf:a', 'value1'

3 查询:
  scan 'test'

4 查询一行 

  

get 'test', 'row1'

5 禁用一张表
  disable 'test' 6 删除一张表:(只有禁用了的才能删除)
  
drop 'test' 7 停止 hbase:
  
 ./bin/stop-hbase.sh
8 查看表结构:
  desc 'test'

----------------------------------------hbase的理论知识点---------------------------------------- 

1 hbase 是一个nosql 数据库。

2 hbase 是一个 列存数类型nosql据库

3 hbase 数据存放的 没一行必须有 rowkey 。并且查询几乎都需要使用到 rowkey,所以 rowkey 生成规则非常重要。

4 hbase  需要预定义列族(  column fmaliy  ),在定义表的时候5 hbase 官方建议 列族不超过3 个,因为为超过三个带来的性能消耗问题目前还没有太好的解决方

6 hbase 的 真正列叫做 colunm。
可以在 put 数据的时候任意指定。 7 hbase 决定一个数据cell的因数 , rowkey( 行号) ,cf(列族) ,column(列)和 timestamp( 时间)。 8 cell 中的数据是 以 key value 的形式存储的。key 的组成:key = {rowkey + column + version}, cell 里面的 value 是 数据的字数组。和 基于内存的 key-value nosql 数据库不同的是 这个 value 主要是放在 硬盘。 9 cell 是 hbase存储数据的基本单元。 10 每次向 hbase 使用的 hdfs 存储数据,不利于修改,hbase的修改 是一时间毫秒数最为 version 另外存了一份,如果 最大当前 rowkey 对应的 column 对应的数据版本超过表允许的版本,那么会自动删除当前数据块最旧一个的版本。 11 HLog ( WAL log ) 类似数据库 的 tranlog , 具体里面有什么 有空查询一下。 12 hbase 体系架构图
   13 hbase 的 主节点叫做 HMaster,从节点叫做 HRegionserver。 14 一个 HRegionServer 有 多个 Hregion, 但是 只有一个Hlog 。

 15 HRegion 把表中的数据进行横向切分(按照rowkey ,rowkey 连续的一部分放在一起的,有序的)。

 

16 HRegion 下面有多个 Store ,每一个 Store 代表一个 列族。如果这个表只有一个 cf 那么  就只有一个 store。(并且每一个 cf 的数据都存在同一个目录下)

 

17 store 分 2 种 ,一种叫做 memStore ,一种叫做 storeFile。

 

18 memStore 是数据刚 写入的时候在内存中。这时候就是在 memstore 里面。

 

19 当 memstore 触发溢写的时候 ,产生 storeFile ,每次溢写都产生一个新的 storeFile。

 

20 当系统的 storeFile 多到一定数量,就会触发合并压缩,产生更大的 单个 storeFile。

 

21 合并压缩分2 中,一种 辅助压缩(  minor compaction),一种是主要压缩( major compaction )

 

22 只有 major compaction 才能版本合并和删除老版本数据。

 

23 当某个 region 的所有的 storeFile 大于 一定值的时候会吧自己分成2 个region,这个过程叫做裂变,并且 hmaster 会把其中一个region 分到合适的regionserver 上。

  24 master 做的事情

    1 为 region server 分配region。

    2 负责 region server 的负载均衡(吧 region 分给 region 少的region server)

    3 如果有 region server下线。那么在别的region server 上找到  这个 region server 上的 region ,并且重新复制这些region,并且分配各合适的 region server。

    4 管理用户的 table的 增删改操作。

  region server 做的事情

    1 维护自己管理的region,处理这些region的io 请求

    2 负责切片 运行过程中变得 过大的 region,这个过程叫做 region的  裂变。

 

25 HRegion 是hbase 中分布式存储和负载均衡的最小单元。 一个表的多个 region 可以在不同region server 上。

  26 storeFile 是 以 Hfile 的格式存在hdfs 上的。

 27 如果没有溢写 过,那么这时候 store 没有storeFile, 在 hdfs 上 就没有 数据。

28  hbase 数据模型

  





hbase 相关的更多相关文章

  1. HBase相关的一些点

    1.在运行Hbase时,如果遇到出错之后: 可以通过{HBASE_HOME}目录,我的是在/usr/soft/hbase下的logs子目录中的日志文件查看错误原因.2.启动关闭Hadoop和HBase ...

  2. Spark-读写HBase,SparkStreaming操作,Spark的HBase相关操作

    Spark-读写HBase,SparkStreaming操作,Spark的HBase相关操作 1.sparkstreaming实时写入Hbase(saveAsNewAPIHadoopDataset方法 ...

  3. HBase相关

    hadoop和hbase节点添加和单独重启 有时候hadoop或hbase集群运行时间久了后,某些节点就会失效,这个时候如果不想重启整个集群(这种情况在很多情况下已经不被允许),这个时候可以单独重启失 ...

  4. HBase 相关API操练(三):MapReduce操作HBase

    MapReduce 操作 HBase 在 HBase 系统上运行批处理运算,最方便和实用的模型依然是 MapReduce,如下图所示. HBase Table 和 Region 的关系类似 HDFS ...

  5. HBase 相关API操练(一):Shell操作

    HBase 为用户提供了一个非常方便的使用方式, 我们称之为“HBase Shell”. HBase Shell 提供了大多数的 HBase 命令, 通过 HBase Shell 用户可以方便地创建. ...

  6. 暑假第五周总结(学习HBASE相关知识)

    本周主要对HBASE的相关知识进行了学习,主要是通过视频的讲解了解到了HBASE的存储机制,HBASE的机制与普通的关系型数据库完全不同,HBASE以列进行存储,其主要执行的就是增删查操作,其更改主要 ...

  7. 大数据Hbase相关运维题

    1.启动先电大数据平台的 Hbase 数据库,其中要求使用 master 节点的RegionServer.在 Linux Shell 中启动 Hbase shell,查看 HBase 的版本信息.(相 ...

  8. HBase篇--HBase操作Api和Java操作Hbase相关Api

    一.前述. Hbase shell启动命令窗口,然后再Hbase shell中对应的api命令如下. 二.说明 Hbase shell中删除键是空格+Ctrl键. 三.代码 1.封装所有的API pa ...

  9. HBase相关问题

    HBase和Hive的异同之处? 共同点:HBase与Hive都是架构在Hadoop之上,底层存储都是使用HDFS 区别: 1). Hive是建立在Hadoop之上为了减少MapReduce jobs ...

随机推荐

  1. Vuejs2.0学习(Render函数,createElement,vm.$slots)

    直接来到进阶部分, Render函数 直接来到Render,本来也想跳过,发现后面的路由貌似跟它还有点关联.先来看看Render 1.1 官网一开始就看的挺懵的,不知道讲的是啥,动手试了一下,一开头讲 ...

  2. 二、先在SD卡上启动U-boot,再烧写新的U-boot进Nandflash

    1. 制作SD卡 先准备一张2G的SD卡(不能用8G的,2G的卡和8G的卡协议不一样),和烧写SD卡的工具write_sd以及需要烧写到SD卡中的u-boot-movi.bin.将SD卡格式化后连接到 ...

  3. office web apps server安装部署

    操作系统:windows 2012 软件下载地址: 链接:https://pan.baidu.com/s/1c3WWFs8 密码:4dcy NDP452-KB2901954-Web.exe(.Net ...

  4. 界面设计-Edit控件的Style设置

    以下文字转贴ChinaCock QQ 223717588群: 1. 首先在Form上放一个TEdit类型控件Edit1,最终的效果如下图: 2.选中控件Edit1,点击鼠标右键,在弹出菜单中选择“Ed ...

  5. 【Think in java读书笔记】IO系统

    一.FIle类(处理文件目录问题) if else的另外一种写法 ,不加大括号也可以 import java.io.File; import java.io.FilenameFilter; impor ...

  6. Power BI新主页将使内容的导航和发现变得轻而易举!

    微软Power BI 将在近日发布Power BI Home登陆页面的公开预览以及Power BI服务中的新全局搜索功能.登录页将成为所有内容的一站式集合,并提供更快捷的方式来分享你的仪表板.原来在左 ...

  7. 第三十二课 linux内核链表剖析

    __builtin_prefetch是gcc扩展的,用来提高访问效率,需要硬件的支持. 在标准C语言中是不允许static inline联合使用的. 删除依赖的头文件,将相应的结构拷贝到LinuxLi ...

  8. JavaScript条件语句-5--if语句的嵌套

    JavaScript条件语句 学习目标 1.掌握length属性的应用 2.掌握if语句的嵌套 length 语法:string.length 功能:获取string字符串的长度 返回值:number ...

  9. ubuntu discuz 该函数需要 PHP 支持 XML。请联系空间商,确定开启了此项功能

    apt-get install php-xml apt-get install php-xml-parser

  10. batch normalization在测试时的问题

    验证: 在测试时可以一张图,但设置use_global_stats:true,已经验证,第一台4gpu上,路径:/home/guangcong/projects/unlabeled-video/tra ...