转载请注明出处:http://blog.csdn.net/l1028386804/article/details/46447573

1.HBase(NoSQL)的数据模型

1.1 表(table)

存储管理数据的。

1.2 行键(row key)

类似于MySQL中的主键。

行键是HBase表天然自带的。

1.3 列族(column family)

列的集合。

HBase中列族是须要在定义表时指定的,列是在插入记录时动态添加的。

    HBase表中的数据,每一个列族单独一个文件。

1.4 时间戳(timestamp)

列(也称作标签、修饰符)的一个属性。

行键和列确定的单元格,能够存储多个数据,每一个数据含有时间戳属性,数据具有版本号特性。    

    假设不指定时间戳或者版本号。默认取最新的数据。

1.5 存储的数据都是字节数组。

1.6 表中的数据是依照行键的顺序物理存储的。

2.HBase的物理模型

2.1 HBase是适合海量数据(如20PB)的秒级简单查询的数据库。

2.2 HBase表中的记录。依照行键进行拆分。 拆分成一个个的region。

很多个region存储在region server(单独的物理机器)中的。

这样。对表的操作转化为对多台region server的并行查询。

3.HBase的体系结构

3.1 HBase是主从式结构,HMaster、HRegionServer

4.HBase伪分布安装

4.1 解压缩、重命名、环境变量设置

4.2 改动$HBASE_HOME/conf/hbase-env.sh

改动内容例如以下:

export JAVA_HOME=/usr/local/jdk

    export HBASE_MANAGES_ZK=true

4.3 改动$HBASE_HOME/conf/hbase-site.xml

改动内容例如以下:

<property>

      <name>hbase.rootdir</name>

      <value>hdfs://hadoop0:9000/hbase</value>

    </property>

    <property>

      <name>hbase.cluster.distributed</name>

      <value>true</value>

    </property>

    <property>

      <name>hbase.zookeeper.quorum</name>

      <value>hadoop0</value>

    </property>

    <property>

      <name>dfs.replication</name>

      <value>1</value>

    </property>

4.4 (可选)文件regionservers的内容为hadoop0

4.5 启动hbase。运行命令start-hbase.sh

******启动hbase之前,确保hadoop是执行正常的,而且能够写入文件*******

4.6 验证:

(1)运行jps,发现新添加了3个java进程,各自是HMaster、HRegionServer、HQuorumPeer

(2)使用浏览器来访问http://hadoop0:60010

版权声明:本文博主原创文章,博客,未经同意不得转载。

Hadoop之——HBase注意事项的更多相关文章

  1. 基于Hadoop技术实现的离线电商分析平台(Flume、Hadoop、Hbase、SpringMVC、highcharts)

    离线数据分析平台是一种利用hadoop集群开发工具的一种方式,主要作用是帮助公司对网站的应用有一个比较好的了解.尤其是在电商.旅游.银行.证券.游戏等领域有非常广泛,因为这些领域对数据和用户的特性把握 ...

  2. 使用ganglia监控hadoop及hbase集群

    一.Ganglia简介 Ganglia 是 UC Berkeley 发起的一个开源监视项目,设计用于测量数以千计的节点.每台计算机都运行一个收集和发送度量数据(如处理器速度.内存使用量等)的名为 gm ...

  3. hadoop +zookeeper + hbase 单节点安装

    项目描述: 今天花了680元买了阿里云的一台内存1G, 带宽1M 的云主机. 想以后方便测试用,而且想把自己的博客签到自己的主机上.所以自己就搭了一个测试的环境. 可以用来进行基本的hbase 入库, ...

  4. Hadoop 之Hbase命令

    一.常用命令:(hbase shell 进入终端) 1.创建表: create 'users','user_id','address','info' 表users,有三个列族user_id,addre ...

  5. 使用Ganglia监控hadoop、hbase

    Ganglia是一个监控服务器,集群的开源软件,能够用曲线图表现最近一个小时,最近一天,最近一周,最近一月,最近一年的服务器或者集群的cpu负载,内存,网络,硬盘等指标. Ganglia的强大在于:g ...

  6. spring hadoop 访问hbase入门

    1.  环境准备: Maven Eclipse Java Spring 版本 3..2.9 2. Maven  pom.xml配置 <!-- Spring hadoop --> <d ...

  7. hadoop、hbase、hive、zookeeper版本对应关系

    本文引用自:http://www.aboutyun.com/blog-61-62.html 最新版本: hadoop和hbase版本对应关系: Hbase    Hadoop 0.92.0 1.0.0 ...

  8. hadoop中hbase出现的问题

    在安装hbase中出现问题如下: ERROR: Can't get master address from ZooKeeper; znode data == null 解决办法: 1.删除nameno ...

  9. hadoop浅尝 hadoop与hbase交互

    在安装好hbase之后,运行一个与hadoop无关的纯hbase程序成功了. 接着写一个hadoop与hbase进行交互的小程序,这个程序的运行方法依然与前文相同, 即导出jar文件在shell下运行 ...

随机推荐

  1. 在MyEclipse8.5中配置Tomcat6.0服务器

    一.单击工具栏的的黑小三角,选择—>Configure Server,出现首选项对话框,在对话框的左边框中找到MyEclipse—>Application Servers下找到Tomcat ...

  2. PV操作——生产者和消费者

    首先,先来看几个概念: 同步:协作的过程,比如,多人开发合作. 相互排斥:争抢资源的过程.比如苦逼的大学选课: 临界区:进程中对临界资源实施操作的那段程序: 临界资源:一次仅仅能一个进程使用的资源,比 ...

  3. sizeClass和autolayout学习资源整理

    sizeClass和autolayout,看来不得不開始放弃frame的写法,收集点资料集中学习下 Adaptivity User Interfaces苹果官方文档:https://developer ...

  4. C#(SuperWebSocket)与websocket通信

    原文:C#(SuperWebSocket)与websocket通信 客户端代码 点击可以查看一些关于websocket的介绍 <!DOCTYPE html> <html> &l ...

  5. sails 相关文章

    Node 框架之sails   http://cnodejs.org/topic/555c3c82e684c4c8088a0ca1

  6. 采用ToolRunner执行Hadoop基本面分析程序

    为了简化执行作业的命令行.Hadoop它配备了一些辅助类.GenericOptionsParser它是一类.经常用来解释Hadoop命令行选项,并根据需要.至Configuration采取相应的对象设 ...

  7. linux进程通信之共享内存

    共享内存同意两个或多个进程共享一给定的存储区,由于数据不须要来回复制,所以是最快的一种进程间通信机制.共享内存能够通过mmap()映射普通文件(特殊情况下还能够採用匿名映射)机制实现,也能够通过系统V ...

  8. Linux鸟哥的私房菜(3)— 总体规划和磁盘分区 读书笔记

    1.每个硬件设备Linux中的文件名称 在Linux系统中.每一个设备都被当成一个文件来对待.而且差点儿全部的硬件设备文件都在/dev文件夹下 常见设备与其对于文件名称 2.磁盘连接的方式与设备文件名 ...

  9. 孙陪你,了解它的权力--Kinect结合的发展Unity3D游戏应用开发

    unity3d正在使用kinect三维模型数据控制(它切成脚本) 博主在做项目时须要利用kinect数据控制三维模型中人物的动作.但不是实时控制,而是利用之前获得的骨骼数据,直接控制.无需再利用脚本打 ...

  10. StackExchange.Redis 使用 - 事件(五)

    ConnectionMultiplexer 可以注册如下事件 ConfigurationChanged - 配置更改时 ConfigurationChangedBroadcast - 通过发布订阅更新 ...