hbase相关操作
hbase安装
下载 wget http://apache.gree.com/apache/hbase/hbase-1.2.11/hbase-1.2.11-bin.tar.gz
tar -zxvf base-1.2.11-bin.tar.gz -C /usr/local/
mv /ussr/local/hbase-1.2.11 /usr/local/hbase
配置环境
vi /etc/profile
export HBASE_HOME=/usr/local/hbase
export PATH=$HBASE_HOME/bin:$PATH
保存退出
source /etc/profile
编辑HBASE_HOME/conf/hbase-env.sh,添加
export JAVA_HOME=/usr/java/jdk1.8.0_191-amd64/jre
export HBASE_CLASSPATH=/usr/local/hadoop/conf
export HBASE_MANAGES_ZK=false 不使用hbase自带的zookeeper,使用外部的zookeeper管理hbase
编辑 HBASE_HOME/conf/hbase-site.xml
<configuration>
<property>
<!--设置hbasemaster的主机和端口-->
<name>hbase.master</name>
<value>HDP-master:60000</value>
</property>
<property>
<!-- 设置hbase在HDFS上的存储路径,要与hadoop的core-site.xml中的fs.defaultFS路径一致 -->
<name>hbase.rootdir</name>
<value>hdfs://HDP-master:9000/hbase</value>
</property>
<property>
<!-- 指定hbase是分布式的 -->
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<property>
<!-- 指定外部zookeeper地址,多个用‘,’分隔 -->
<name>hbase.zookeeper.quorum</name>
<value>HDP-master,HDP-slave1,HDP-slave2</value>
</property> </configuration>
编辑HBASE_HOME/conf/regionservers ,设置hbase的从节点(安装regionserver的节点)添加
HDP-slave1
HDP-slave2
退出保存
hbase集群之间要进行数据同步,除了要配置ssh免密连接之外,还要保证各个服务器的时间一致,所以要配置时间同步
选定一个服务器,将其时间设置为标准时间,进行配置
主服务器 编辑 /etc/chrony.conf 添加
allow 10.2.14.0/24 设置允许哪些网段的机器同步本机时间
local stratum 10 不去同步任何机器的时间,设置时间同步服务器级别
保存退出
systemctl restart chronyd
从服务器 编辑/etc/chrony.conf
将
server 0.rhel.pool.ntp.org.iburst
...
server 4.rhel.pool.ntp.org iburst
修改为:
server 10.2.xxx.xx iburst ip为主服务器的IP,设置同步时间的源服务器
保存退出
重启chronyd
systemctl restart chronyd
测试,可通过指令查看各机器时间
watch -n 1 date
更正主服务器时间
date -s 10/24/2019
date -s 17:23:22
要启动hbase,需要先依次启动zookeeper,hadoop
启动zookeeper,集群中每台机子都需要执行
zookeeper/bin/zkServer.sh start
zookeeper/bin/zkServer.sh status
启动hadoop(仅需在主节点执行)
sbin/start-all.sh
启动hbase(仅需在主节点执行)
/usr/local/hbase/bin/start-hbase.sh
hbase启动后在master用jps查看时是 HMaster ,在slave上是HRegionServer进程
在命令行 执行hbase shell即可以进入hbase的shell
list 列出所有的hbase表
describe table_name 查看表结构
scan table_name 遍历表中的数据
get table_name, rowkey 查看表中主键为rowkey的一行数据
get table_nmae,rowkey,column:qualifier 查看表中指定行,指定列簇的指定列的值
get table_name,rowkey,{COLUMN => 'colum_name',TIMESTAMP => 15555699956861,FILTER =>"QualifierFilter(=, 'binary:Gil/0/31')"} 查看表中指定rowkey指定列簇中符合条件的列的数据
hbase相关操作的更多相关文章
- Spark-读写HBase,SparkStreaming操作,Spark的HBase相关操作
Spark-读写HBase,SparkStreaming操作,Spark的HBase相关操作 1.sparkstreaming实时写入Hbase(saveAsNewAPIHadoopDataset方法 ...
- HBase相关的一些点
1.在运行Hbase时,如果遇到出错之后: 可以通过{HBASE_HOME}目录,我的是在/usr/soft/hbase下的logs子目录中的日志文件查看错误原因.2.启动关闭Hadoop和HBase ...
- 从零自学Hadoop(20):HBase数据模型相关操作上
阅读目录 序 介绍 命名空间 表 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 ...
- 从零自学Hadoop(21):HBase数据模型相关操作下
阅读目录 序 变量 数据模型操作 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 ...
- HBase 相关API操练(三):MapReduce操作HBase
MapReduce 操作 HBase 在 HBase 系统上运行批处理运算,最方便和实用的模型依然是 MapReduce,如下图所示. HBase Table 和 Region 的关系类似 HDFS ...
- HBase相关
hadoop和hbase节点添加和单独重启 有时候hadoop或hbase集群运行时间久了后,某些节点就会失效,这个时候如果不想重启整个集群(这种情况在很多情况下已经不被允许),这个时候可以单独重启失 ...
- 【甘道夫】HBase基本数据操作的详细说明【完整版,精绝】
介绍 之前具体写了一篇HBase过滤器的文章.今天把基础的表和数据相关操作补上. 本文档參考最新(截止2014年7月16日)的官方Ref Guide.Developer API编写. 全部代码均基于& ...
- 从零自学Hadoop(24):Impala相关操作上
阅读目录 序 数据库相关 表相关 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 ...
- hbase简单操作
hbase有hbase shell以及hbase 客户端api两种方式进行hbase数据库操作: 首先,hbase shell是在linux命令行进行操作,输入hbase shell命令,进入shel ...
随机推荐
- 默认VS 下machine.config的位置
- Docker容器数据卷介绍和命令
是什么 一句话:有点类似我们Redis里面的rdb和aof文件 先来看看Docker的理念: * 将运用与运行的环境打包形成容器运行 ,运行可以伴随着容器,但是我们对数据的要求希望是持久化的 * ...
- JVM-5-GC(Garbage Collection) 垃圾回收机制
GC(Garbage Collection) 垃圾回收机制 什么是垃圾回收机制 垃圾回收是一种动态存储管理技术,它自动地释放不再被程序引用的对象,按照特定的垃圾收集算法来实现资源自动回收的功能. ...
- 201871010116-祁英红《面向对象程序设计(java)》第一周学习总结
项目 内容 <面向对象程序设计(java)> https://www.cnblogs.com/nwnu-daizh/ 这个作业的要求在哪里 https://www.cnblogs.com/ ...
- 【转】bootstrap table轻松实现数据表格
在使用bootstrap table时可能在很多时候回用的表格来显示数据,如果自己写那肯定没问题,但是数据展示出来就麻烦多了,然而bootstrap table 封装了一套完善的数据表格组件,把从后台 ...
- Java内存中的常量池
1,java内存模型简介 <深入理解java虚拟机>里将java内存分为如下五个模块: 堆-堆是所有线程共享的,主要用来存储对象. 其中,堆可分为:新生代和老年代两块区域.使用NewRat ...
- git必知必会
1. Git 配置 --system #系统级别--global #用户全局--local #单独一个项目 git config --global user.name "xxxx" ...
- 关闭Chrome浏览器的广告
生活没有绝对的对与错:代码就不一样了,错了就编译不过,也正是因为这样,编程的人思维有时也会陷入一种狭隘中,这就是把工作和生活没有分开.Win10 右下角的广告就像程序调试中的"警告" ...
- MySQL索引知识学习笔记
目录 一.索引的概念 二.索引分类 三.索引用法 四 .索引架构简介 五.索引适用的情况 六.索引不适用的情况 继我的上篇博客:Oracle索引知识学习笔记,再记录一篇MySQL的索引知识学习笔记,本 ...
- php-laravel框架用户验证(Auth)模块解析(一)
一.初始化 使用php artisan命令进行初始化:php artisan make:auth 和 php artisan migrate(该命令会生成users表.password_resets表 ...