1.HBase读写的方式概况

主要分为：

纯Java API读写HBase的方式；
Spark读写HBase的方式；
Flink读写HBase的方式；
HBase通过Phoenix读写的方式；

第一种方式是HBase自身提供的比较原始的高效操作方式，而第二、第三则分别是Spark、Flink集成HBase的方式，最后一种是第三方插件Phoenix集成的JDBC方式，Phoenix集成的JDBC操作方式也能在Spark、Flink中调用。

注意：

这里我们使用HBase2.1.2版本，以下代码都是基于该版本开发的。

2. 纯Java API读写HBase

2.1 连接HBase

这里我们采用静态方式连接HBase，不同于2.1.2之前的版本，无需创建HBase线程池，HBase2.1.2提供的代码已经封装好，只需创建调用即可：

/**

  * 声明静态配置

  */

static Configuration conf = null;

static Connection conn = null;

static {

       conf = HBaseConfiguration.create();

       conf.set("hbase.zookeeper.quorum", "hadoop01,hadoop02,hadoop03");

       conf.set("hbase.zookeeper.property.client", "2181");

       try{

           conn = ConnectionFactory.createConnection(conf);

       }catch (Exception e){

           e.printStackTrace();

       }

}

2.2 创建HBase的表

创建HBase表，是通过Admin来执行的，表和列簇则是分别通过TableDescriptorBuilder和ColumnFamilyDescriptorBuilder来构建。

/**

 * 创建只有一个列簇的表

 * @throws Exception

 */

public static void createTable() throws Exception{

    Admin admin = conn.getAdmin();

    if (!admin.tableExists(TableName.valueOf("test"))){

        TableName tableName = TableName.valueOf("test");

        //表描述器构造器

        TableDescriptorBuilder tdb = TableDescriptorBuilder.newBuilder(tableName);

        //列族描述器构造器

        ColumnFamilyDescriptorBuilder cdb = ColumnFamilyDescriptorBuilder.newBuilder(Bytes.toBytes("user"));

        //获得列描述器

        ColumnFamilyDescriptor cfd = cdb.build();

        //添加列族

        tdb.setColumnFamily(cfd);

        //获得表描述器

        TableDescriptor td = tdb.build();

        //创建表

        admin.createTable(td);

    }else {

        System.out.println("表已存在");

    }

    //关闭连接

}

2.3 HBase表添加数据

通过put api来添加数据

/**

 * 添加数据（多个rowKey，多个列族）

 * @throws Exception

 */

public static void insertMany() throws Exception{

    Table table = conn.getTable(TableName.valueOf("test"));

    List<Put> puts = new ArrayList<Put>();

    Put put1 = new Put(Bytes.toBytes("rowKey1"));

    put1.addColumn(Bytes.toBytes("user"), Bytes.toBytes("name"), Bytes.toBytes("wd"));

    Put put2 = new Put(Bytes.toBytes("rowKey2"));

    put2.addColumn(Bytes.toBytes("user"), Bytes.toBytes("age"), Bytes.toBytes("25"));

    Put put3 = new Put(Bytes.toBytes("rowKey3"));

    put3.addColumn(Bytes.toBytes("user"), Bytes.toBytes("weight"), Bytes.toBytes("60kg"));

    Put put4 = new Put(Bytes.toBytes("rowKey4"));

    put4.addColumn(Bytes.toBytes("user"), Bytes.toBytes("sex"), Bytes.toBytes("男"));

    puts.add(put1);

    puts.add(put2);

    puts.add(put3);

    puts.add(put4);

    table.put(puts);

    table.close();

}

2.4 删除HBase的列簇或列

/**

 * 根据rowKey删除一行数据、或者删除某一行的某个列簇，或者某一行某个列簇某列

 * @param tableName

 * @param rowKey

 * @throws Exception

 */

public static void deleteData(TableName tableName, String rowKey, String rowKey, String columnFamily, String columnName) throws Exception{

    Table table = conn.getTable(tableName);

    Delete delete = new Delete(Bytes.toBytes(rowKey));

    //①根据rowKey删除一行数据

    table.delete(delete);

    //②删除某一行的某一个列簇内容

    delete.addFamily(Bytes.toBytes(columnFamily));

    //③删除某一行某个列簇某列的值

    delete.addColumn(Bytes.toBytes(columnFamily), Bytes.toBytes(columnName));

    table.close();

}

2.5 更新HBase表的列

使用Put api直接替换掉即可

/**

 * 根据RowKey , 列簇， 列名修改值

 * @param tableName

 * @param rowKey

 * @param columnFamily

 * @param columnName

 * @param columnValue

 * @throws Exception

 */

public static void updateData(TableName tableName, String rowKey, String columnFamily, String columnName, String columnValue) throws Exception{

    Table table = conn.getTable(tableName);

    Put put1 = new Put(Bytes.toBytes(rowKey));

    put1.addColumn(Bytes.toBytes(columnFamily), Bytes.toBytes(columnName), Bytes.toBytes(columnValue));

    table.put(put1);

    table.close();

}

2.6 HBase查询

HBase查询分为get、scan、scan和filter结合。filter过滤器又分为RowFilter（rowKey过滤器）、SingleColumnValueFilter（列值过滤器）、ColumnPrefixFilter（列名前缀过滤器）。

/**

 * 根据rowKey查询数据

 * @param tableName

 * @param rowKey

 * @throws Exception

 */

public static void getResult(TableName tableName, String rowKey) throws Exception{

    Table table = conn.getTable(tableName);

    //获得一行

    Get get = new Get(Bytes.toBytes(rowKey));

    Result set = table.get(get);

    Cell[] cells = set.rawCells();

    for (Cell cell: cells){

        System.out.println(Bytes.toString(cell.getQualifierArray(), cell.getQualifierOffset(), cell.getQualifierLength()) + "::" +

        Bytes.toString(cell.getValueArray(), cell.getValueOffset(), cell.getValueLength()));

    }

    table.close();

}

//过滤器 LESS <  LESS_OR_EQUAL <=   EQUAL =   NOT_EQUAL <>   GREATER_OR_EQUAL >=   GREATER >   NO_OP 排除所有

/**

 * @param tableName

 * @throws Exception

 */

public static void scanTable(TableName tableName) throws Exception{

    Table table = conn.getTable(tableName);

    //①全表扫描

    Scan scan1 = new Scan();

    ResultScanner rscan1 = table.getScanner(scan1);

    //②rowKey过滤器

    Scan scan2 = new Scan();

    //str$ 末尾匹配，相当于sql中的 %str  ^str开头匹配，相当于sql中的str%

    RowFilter filter = new RowFilter(CompareOperator.EQUAL, new RegexStringComparator("Key1$"));

    scan2.setFilter(filter);

    ResultScanner rscan2 = table.getScanner(scan2);

    //③列值过滤器

    Scan scan3 = new Scan();

    //下列参数分别为列族，列名，比较符号，值

    SingleColumnValueFilter filter3 = new SingleColumnValueFilter(Bytes.toBytes("author"), Bytes.toBytes("name"),

               CompareOperator.EQUAL, Bytes.toBytes("spark"));

    scan3.setFilter(filter3);

    ResultScanner rscan3 = table.getScanner(scan3);

    //列名前缀过滤器

    Scan scan4 = new Scan();

    ColumnPrefixFilter filter4 = new ColumnPrefixFilter(Bytes.toBytes("name"));

    scan4.setFilter(filter4);

    ResultScanner rscan4 = table.getScanner(scan4);

    //过滤器集合

    Scan scan5 = new Scan();

    FilterList list = new FilterList(FilterList.Operator.MUST_PASS_ALL);

    SingleColumnValueFilter filter51 = new SingleColumnValueFilter(Bytes.toBytes("author"), Bytes.toBytes("name"),

              CompareOperator.EQUAL, Bytes.toBytes("spark"));

    ColumnPrefixFilter filter52 = new ColumnPrefixFilter(Bytes.toBytes("name"));

    list.addFilter(filter51);

    list.addFilter(filter52);

    scan5.setFilter(list);

    ResultScanner rscan5 = table.getScanner(scan5);

    for (Result rs : rscan){

        String rowKey = Bytes.toString(rs.getRow());

        System.out.println("row key :" + rowKey);

        Cell[] cells = rs.rawCells();

        for (Cell cell: cells){

            System.out.println(Bytes.toString(cell.getFamilyArray(), cell.getFamilyOffset(), cell.getFamilyLength()) + "::"

                    + Bytes.toString(cell.getQualifierArray(), cell.getQualifierOffset(), cell.getQualifierLength()) + "::"

                    + Bytes.toString(cell.getValueArray(), cell.getValueOffset(), cell.getValueLength()));

        }

        System.out.println("-------------------------------------------");

    }

}

3.总结

HBase连接的几种方式（二）spark篇查看Spark上读写HBase

HBase读写的几种方式（三）flink篇查看flink上读写HBase

github地址：

https://github.com/SwordfallYeung/HBaseDemo

参考资料：

https://hbase.apache.org/book.html

HBase读写的几种方式（一）java篇的更多相关文章

HBase读写的几种方式（二）spark篇
1. HBase读写的方式概况主要分为: 纯Java API读写HBase的方式: Spark读写HBase的方式: Flink读写HBase的方式: HBase通过Phoenix读写的方式: 第一 ...
【转帖】HBase读写的几种方式（二）spark篇
HBase读写的几种方式(二)spark篇 https://www.cnblogs.com/swordfall/p/10517177.html 分类: HBase undefined 1. HBase ...
HBase读写的几种方式（三）flink篇
1. HBase连接的方式概况主要分为: 纯Java API读写HBase的方式: Spark读写HBase的方式: Flink读写HBase的方式: HBase通过Phoenix读写的方式: 第一 ...
java向MySQL插入当前时间的四种方式和java时间日期格式化的几种方法(案例说明)
转载地址:http://www.devba.com/index.php/archives/4581.html java向MySQL插入当前时间的四种方式和java时间日期格式化的几种方法(案例说明); ...
（转）java向MySQL插入当前时间的四种方式和java时间日期格式化的几种方法(案例说明)
java向MySQL插入当前时间的四种方式和java时间日期格式化的几种方法(案例说明);部分资料参考网络资源 1. java向MySQL插入当前时间的四种方式第一种:将java.util.Date ...
java文件读写的两种方式
今天搞了下java文件的读写,自己也总结了一下,但是不全,只有两种方式,先直接看代码: public static void main(String[] args) throws IOExceptio ...
Struts 2 实现Action的几种方式_java - JAVA
文章来源:嗨学网敏而好学论坛www.piaodoo.com 欢迎大家相互学习 Action用于处理用户的请求,因此也被称为业务控制器.每个Action类就是一个工作单元,Struts 2框架负责将用 ...
两种方式实现java生成Excel
Web应用中难免会遇到需要将数据导出并生成excel文件的需求.同样,对于本博客中的总结,也是建立在为了完成这样的一个需求,才开始去了解其实现形式,并且顺利完成需求的开发,先将实现过程总结于此.本博文 ...
3种方式实现Java多线程
java中实现多线程的方法有两种:继承Thread类和实现runnable接口. 1.继承Thread类,重写父类run()方法 public class thread1 extends Thread ...

随机推荐

oracle EM 如何调整界面显示的语言
EM是通过浏览器语言来识别界面语言的,没有选项调整.我以chrome为例将默认中文改为英文: EM调整前为中文界面: 调整chrome语言显示为英文: 再重新开一个窗口,打开EM,界面已经调整为英文了 ...
英语口语练习系列-C08-考试
<蒹葭>-诗经蒹葭苍苍,白露为霜.所谓伊人,在水一方.溯洄从之,道阻且长.溯游从之,宛在水中央. 蒹葭萋萋,白露未晞.所谓伊人,在水之湄.溯洄从之,道阻且跻.溯游从之,宛在水中坻. 蒹葭 ...
JS第二部分--DOM文档对象模型
一.DOM的概念二.DOM可以做什么三.DOM对象的获取四.事件的介绍五.DOM节点标签样式属性的操作六.DOM节点对象对值的操作七.DOM节点-标签属性的操作(例如id class sr ...
socketServer并发处理socket
socketserver简单介绍 ''' socketserver:是对socket的封装,实现并发处理前两个TCP,UDP常用,后两个不常用 ''' import socketserver soc ...
错误ERROR datanode.DataNode (DataXceiver.java：run(278)) - hadoop07：50010DataXceiver error processing unknown operation src：127.0.0.136479 dst：127.0.0.150010
原因: Ambari 每分钟会向datanode发送"ping"连接一下去确保datanode是正常工作的.否则它会触发alert.但是datanode并没有处理空内容的逻辑,所以 ...
011_Python中单线程、多线程和多进程的效率对比实验
Python是运行在解释器中的语言,查找资料知道,python中有一个全局锁(GIL),在使用多进程(Thread)的情况下,不能发挥多核的优势.而使用多进程(Multiprocess),则可以发挥多 ...
Analyzing 'enq: HW - contention' Wait Event (Doc ID 740075.1)
Analyzing 'enq: HW - contention' Wait Event (Doc ID 740075.1) In this Document Symptoms Cause ...
Mac中安装git后，终端运行git出错，提示安装Xcode
mac用户不使用Xcode安装git之后,默认安装路径是: /usr/local/git 但是在终端运行 git 命令时候的路径是: /usr/bin/git 当我们输入 git 命令时出现如下错误, ...
SQL语句检索数据排序及过滤
阅读目录一:排序检索数据二:过滤数据三:高级数据过滤四:用通配符进行过滤回到顶部一:排序检索数据 1.1 排序数据比如查询数据库中表数据的时候,我们使用如下语句: select * fr ...
时序数据库InfluxDB：简介及安装
在性能测试过程中,对测试结果以及的实时监控与展示也是很重要的一部分.这篇博客,介绍下linux环境下InfluxDB的安装以及功能特点. 官网地址:influxdata 官方文档:influxdb文档 ...

HBase读写的几种方式（一）java篇