Hbase的基本操作(CDH组件可用)
Habse创建一张表:
1,创建一个命名空间NameSpace(命名空间NameSpace指的是一个表的逻辑分组 ,同一分组中的各个表有类似的用途,相当于关系型数据库中的DataBase)
admin.createNamespace(NamespaceDescriptor.create("MyNamespace").build());
NamespaceDescriptor类用于对NameSpace的描述
在Hbase中,命名空间、表、列族的创建,都需要先进行描述NamespaceDescriptor、HTableDescriptor、HColumnDescriptor,才能进行相应的操作。
2,创建一张表
//创建tablename对象,描述表的名称信息,命名空间在此处使用
TableName tname = TableName.valueOf("MyNamespace:students");
//创建HTableDescriptor对象,描述表信息
HTableDescriptor tDescriptor = new HTableDescriptor(tname);
//创建HColumnDescriptor对象,描述列族信息
HColumnDescriptor famliy = new HColumnDescriptor("core");
//将列族的描述信息添加进表的描述信息
tDescriptor.addFamily(famliy);
//利用表的描述信息创建一张表
admin.createTable(tDescriptor);
HBase主要的四类操作,分别是:
Put :增加一行,修改一行
Delete :删除一行,删除指定列族,删除指定column的多个版本,删除指定column的制定版本等
Get :获取指定行的所有信息,获取指定行和指定列族的所有colunm,获取指定column,获取指定column的几个版本,获取指定column的指定版本等
Scan :获取所有行,获取指定行键范围的行,获取从某行开始的几行,获取满足过滤条件的行等
maven依赖:
<dependency>
<groupId>org.apache.hbase</groupId>
<artifactId>hbase-it</artifactId>
<version>1.1.2</version>
</dependency>
Java API操作:
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.*;
import org.apache.hadoop.hbase.client.*;
import org.apache.hadoop.hbase.util.Bytes;
import org.junit.After;
import org.junit.Before;
import org.junit.Test; import java.io.IOException;
import java.text.DecimalFormat;
import java.util.ArrayList;
import java.util.Iterator;
import java.util.List; /**
* @Author:Xavier
* @Data:2019-02-20 15:48
**/ public class OptionTest {
private Admin admin = null;
private Connection connection = null;
private Configuration conf = null;
private TableName tname = null; @Before
public void init() throws IOException {
conf = HBaseConfiguration.create();
conf.set("hbase.zookeeper.quorum", "nn01,nn02,dn01,dn02,dn03,dn04");
conf.set("hbase.zookeeper.property.clientPort", "2181");
conf.set("hbase.master", "dn01:60000"); connection = ConnectionFactory.createConnection(conf); admin = connection.getAdmin();
} //创建一张表,指定表名,列族
@Test
public void createTabl() throws IOException { try {
admin.createNamespace(NamespaceDescriptor.create("MyNamespace").build());
} catch (NamespaceExistException e) {
System.out.println("该命名空间已经存在");
} //创建tablename对象,描述表的名称信息
tname = TableName.valueOf("MyNamespace:students");
//创建HTableDescriptor对象,描述表信息
HTableDescriptor tDescriptor = new HTableDescriptor(tname);
if (admin.tableExists(tname)) {
System.out.println("students" + "存在!");
System.exit(0);
} else {
HColumnDescriptor famliy = new HColumnDescriptor("core");
tDescriptor.addFamily(famliy);
admin.createTable(tDescriptor);
System.out.println("创建表成功!");
}
} //获取所有的表
@Test
public void getAllTable() {
if (admin != null) {
try {
HTableDescriptor[] alltable = admin.listTables();
for (HTableDescriptor hTableDesc : alltable) {
System.out.println(hTableDesc.getNameAsString());
}
} catch (IOException e) {
e.printStackTrace();
}
}
} //删除表
@Test
public void deleteTab() throws IOException {
tname = TableName.valueOf("MyNamespace:students");
if (admin.tableExists(tname)) {
admin.disableTable(tname);//先禁用表才能删除
admin.deleteTable(tname);
System.out.println("删除表成功!");
} else {
System.out.println("表不存在");
}
} //插入一条数据
@Test
public void addOneRecord() throws IOException { //通过连接查询tableName对象
tname = TableName.valueOf("MyNamespace:students"); if(admin.tableExists(tname)) { Table table = connection.getTable(tname); Put put = new Put(Bytes.toBytes("lisi"));
put.add(Bytes.toBytes("core"), Bytes.toBytes("math"), Bytes.toBytes("98")); table.put(put);
System.out.println("插入数据成功!");
}else {
System.out.println("插入数据失败");
}
} //插入多条数据
@Test
public void moreInsert() throws IOException {
//测试在数据前补零
DecimalFormat format = new DecimalFormat();
format.applyPattern("0000"); tname = TableName.valueOf("MyNamespace:students"); HTable htable = (HTable) connection.getTable(tname); //不要自动清理缓冲区
htable.setAutoFlush(false); // 一个put代表一行数据,再new一个put表示第二行数据,每行一个唯一的RowKey
for (int i = 1; i < 10000; i++) {
Put put = new Put(Bytes.toBytes("leilei" + format.format(i)));
//关闭写前日志
put.setWriteToWAL(false); put.addColumn(Bytes.toBytes("core"), Bytes.toBytes("math"), Bytes.toBytes(format.format(i)));
put.addColumn(Bytes.toBytes("core"), Bytes.toBytes("english"), Bytes.toBytes(format.format(Math.random() * i)));
put.addColumn(Bytes.toBytes("core"), Bytes.toBytes("chinese"), Bytes.toBytes(format.format(Math.random() * i)));
htable.put(put); if (i % 2000 == 0) {
htable.flushCommits();
}
}
htable.flushCommits();
htable.close();
} //通过RowKey,faimly,colum获取cell数据
@Test
public void getData() throws IOException {
tname = TableName.valueOf("MyNamespace:students"); Table table = connection.getTable(tname); //通过RowKey
Get get = new Get(Bytes.toBytes("lisi")); Result result = table.get(get); System.out.println(Bytes.toString(result.getValue(Bytes.toBytes("core"), Bytes.toBytes("math"))));
} //扫描在rowkey范围内的cell数据
@Test
public void deleteRangeRK() throws IOException {
tname = TableName.valueOf("MyNamespace:students");
Table table = connection.getTable(tname); Scan scan = new Scan(); scan.setStartRow(Bytes.toBytes("leilei1000"));
scan.setStopRow(Bytes.toBytes("leilei9999")); ResultScanner resultScanner = table.getScanner(scan); Iterator<Result> iterator = resultScanner.iterator();
while (iterator.hasNext()) {
System.out.println(Bytes.toString((iterator.next()).getValue(Bytes.toBytes("core"), Bytes.toBytes("english"))));
// System.out.println((iterator.next()).toString());
}
} //KeyValue形式查询一行的数据
@Test
public void getValueFromKey() throws IOException {
tname = TableName.valueOf("MyNamespace:students");
Table table = connection.getTable(tname);
Get get = new Get(Bytes.toBytes("lisi")); Result result = table.get(get);
if (result.raw().length == 0) {
System.out.println("不存在该关键字的行!!"); } else {
for (Cell kv : result.rawCells()) {
System.out.println(
"列:"+Bytes.toString(CellUtil.cloneFamily(kv))+":"+Bytes.toString(CellUtil.cloneQualifier(kv))
+"\t 值:"+Bytes.toString(CellUtil.cloneValue(kv)));
} }
} //KeyValue形式查询所有的数据
@Test
public void getAllData() throws Exception {
tname = TableName.valueOf("MyNamespace:students");
Table table = connection.getTable(tname); Scan scan = new Scan();
ResultScanner rs = table.getScanner(scan);
for (Result r : rs) {
for (KeyValue kv : r.raw()) {
System.out.println(Bytes.toString(kv.getKey())
+ Bytes.toString(kv.getValue()));
}
}
} // 删除一行Hbase表中记录信息的
@Test
public void deleteRecord() throws IOException {
tname = TableName.valueOf("MyNamespace:students");
Table table = connection.getTable(tname);
Delete de = new Delete(Bytes.toBytes("leilei9997"));
try {
table.delete(de);
System.out.println("删除记录成功!!!");
} catch (IOException e) {
System.out.println("删除记录异常!!!"); }
} @After
public void destory() throws IOException {
admin.close();
connection.close();
}
}
Hbase的基本操作(CDH组件可用)的更多相关文章
- hbase shell 基本操作
hbase shell 基本操作 启动HBASE [hadoop@master ~]$hbase shell 2019-01-24 13:53:59,990 WARN [main] ut ...
- 1.3.3、CDH 搭建Hadoop在安装之前(端口---CDH组件使用的端口)
列出的所有端口都是TCP. 在下表中,每个端口的“ 访问要求”列通常是“内部”或“外部”.在此上下文中,“内部”表示端口仅用于组件之间的通信; “外部”表示该端口可用于内部或外部通信. Compone ...
- HBase可用性分析与高可用实践
HBase作为一个分布式存储的数据库,它是如何保证可用性的呢?对于分布式系统的CAP问题,它是如何权衡的呢? 最重要的是,我们在生产实践中,又应该如何保证HBase服务的高可用呢? 下面我们来仔细分析 ...
- 2、CDH组件安装
一.zookeeper 1.安装 继续->完成: 二.HDFS 1.安装 继续->完成: 三.yarn.hive 1.安装yarn 继续->完成: 2.安装hive 继续->完 ...
- HBase的基本操作
1.输入hbase shell进入HBase shell
- Hbase shell基本操作
1.启动cd <hbase_home>/bin$ ./start-hbase.sh 2.启动hbase shell # find hadoop-hbase dfs fileshadoop ...
- java对Hbase的基本操作
1.新建一个普通java项目,把${hbase}/lib/目录下的jar包全部导入 2.导出jar文件如下 3.运行 注意:需要先把jar文件导入到hbase路径里去,然后运行相应的类 4.查看数据 ...
- CDH高可用hadoop集群性能配置
1.HDFS的高可用配置 dfs.namenode.edits.dir (NameNode 编辑目录) : 写入 NameNode 编辑的本地文件系统上的目录.未指定将存放在namenode数据目录中 ...
- RN组件可用属性整理
随机推荐
- java面向对象的思想(java三大特性)
用通俗易懂的语言来理解java面向对象的思想 大家都知道,java是面向对象的编程,掌握面向对象的编程思想是掌握java编程语言的核心,但是很多人在面向对象方面都存在或多或少的误区,有的是刚学完C语言 ...
- matlab-画个拱桥和倒影?
matlab可用于各行各业的应用中,现在我们就简单画一个拱桥试一试. r=input('请输入半径: '); z=input('请输入弧度: '); figure() %r=4; %画拱洞,用李萨如图 ...
- OpenCL 矩阵乘法
▶ 矩阵乘法,按照书里的内容进行了几方面的优化,包括局部内存,矢量数据类型,寄存器,流水线等. ● 最直接的乘法.调用时 main.c 中使用 size_t globalSize[] = { rowA ...
- directive
var myModule = angular.module(...); myModule.directive('directiveName', function factory(injectables ...
- github 解决 Agent admitted failure to sign using the key
公司迁移git 新库,重新迁移数据. 添加 ssh key 1. 首先要在新git 库管理平台 添加新的ssh-key : 本机上执行 ssh-keygen -t rsa -C "Your ...
- PHP等值判断中,常量与变量在左在右的区别
在平时写代码过程中,经常会用到判断变量与常量相等的情况,比如if($a==1){…..} 或者if(1==$a) ,从执行效率上来说,1==$a比 $a==1的效率更高. 这个写法的另一个好处,当使用 ...
- python 使用多进程打开多个cmd窗口,并在子进程结束之后关闭cmd窗口
额,我想表达的是使用os.system()打开另一个可执行文件,然后等待其结束,关闭cmd窗口 主要是我突发奇想想装逼; 如果只是用multiprocessing库的多进程,然后输出信息的话,根本没法 ...
- [Sw] 使用 Swoole Server task/协程 处理大数据量异步任务时注意
关于 Buffered Query 和 Unbuffered Query:http://www.php.net/manual/zh/mysqlinfo.concepts.buffering.php 对 ...
- ARTS打卡计划第二周-Review
本周review的文章是:https://medium.com/@hakibenita/optimizing-django-admin-paginator-53c4eb6bfca3 改篇文章的题目是: ...
- TODO:BGP 建立过程
//TODO: Quagga 实时监控配置文件