HBase第三章过滤器

1 列值过滤器

　　SingleColumnValueFilter 对列值进行过滤。

    @Test

    public void scanDataByFilter() throws IOException {

        Table table = connection.getTable(TableName.valueOf("user"));

        Scan scan = new Scan();

        SingleColumnValueFilter singleColumnValueFilter = new SingleColumnValueFilter(Bytes.toBytes("info1"),

                Bytes.toBytes("name"), CompareOp.GREATER, Bytes.toBytes("lisi"));

        scan.setFilter(singleColumnValueFilter);

        ResultScanner scanner = table.getScanner(scan);

        for (Result result : scanner) {

            byte[] name = result.getValue(Bytes.toBytes("info1"), Bytes.toBytes("name"));

            byte[] sex = result.getValue(Bytes.toBytes("info1"), Bytes.toBytes("sex"));

            byte[] age = result.getValue(Bytes.toBytes("info1"), Bytes.toBytes("age"));

            byte[] address = result.getValue(Bytes.toBytes("info1"), Bytes.toBytes("address"));

            System.out.println("name=" + Bytes.toString(name) + ",sex=" + Bytes.toInt(sex) + ",age=" + Bytes.toInt(age)

                    + ",address=" + Bytes.toString(address));

        }

    }

　　扫描全表，用过滤器进行匹配，找出出满足过滤条件的元素。

　　SingleColumnValueFilter

　　参数：列族、列名、操作符、列值

　　操作符可以为：

　　CompareOp.LESS：小于

　　CompareOp.LESS_OR_EQUAL：小于或者等于

　　CompareOp.EQUAL：等于

　　CompareOp.NOT_EQUAL：不等于

　　CompareOp.GREATER_OR_EQUAL：大于或者等于

　　CompareOp.GREATER：大于

　　CompareOp.NO_OP：不比较

2 列名前缀过滤器

　　ColumnPrefixFilter 对列名进行过滤

@Test

    public void scanDataByFilter2() throws IOException {

        Table table = connection.getTable(TableName.valueOf("user"));

        Scan scan = new Scan();

        ColumnPrefixFilter columnPrefixFilter = new ColumnPrefixFilter(Bytes.toBytes("name_"));

        scan.setFilter(columnPrefixFilter);

        ResultScanner scanner = table.getScanner(scan);

        for (Result result : scanner) {

            Cell[] rawCells = result.rawCells();

            for (Cell cell : rawCells) {

                System.out.println("value = " + Bytes.toString(CellUtil.cloneValue(cell)));

                System.out.println("family = " + Bytes.toString(CellUtil.cloneFamily(cell)));

                System.out.println("qualifier = " + Bytes.toString(CellUtil.cloneQualifier(cell)));

            }

        }

    }

　　找出user表中，以'name_'开头的列

3 多个列值前缀过滤器

    @Test

    public void testMultipleColumnPrefixFilter() throws IOException {

        Table table = connection.getTable(TableName.valueOf("user"));

        Scan scan = new Scan();

        byte[][] prefixes = new byte[][] { Bytes.toBytes("name"), Bytes.toBytes("age") };

        MultipleColumnPrefixFilter multipleColumnPrefixFilter = new MultipleColumnPrefixFilter(prefixes);

        scan.setFilter(multipleColumnPrefixFilter);

        ResultScanner scanner = table.getScanner(scan);

        for (Result result : scanner) {

            Cell[] rawCells = result.rawCells();

            for (Cell cell : rawCells) {

                System.out.println("value = " + Bytes.toString(CellUtil.cloneValue(cell)));

                System.out.println("family = " + Bytes.toString(CellUtil.cloneFamily(cell)));

                System.out.println("qualifier = " + Bytes.toString(CellUtil.cloneQualifier(cell)));

            }

        }

    }

　　用于匹配多列，找出以‘name’和‘age’开头的列

4 rowKey过滤器　　

@Test

    public void testRowFilter() throws IOException {

        Table table = connection.getTable(TableName.valueOf("user"));

        Scan scan = new Scan();

        RowFilter rowFilter = new RowFilter(CompareOp.EQUAL, new RegexStringComparator("^00004"));

        scan.setFilter(rowFilter);

        ResultScanner scanner = table.getScanner(scan);

        for (Result result : scanner) {

            Cell[] rawCells = result.rawCells();

            for (Cell cell : rawCells) {

                System.out.println("value = " + Bytes.toString(CellUtil.cloneValue(cell)));

                System.out.println("family = " + Bytes.toString(CellUtil.cloneFamily(cell)));

                System.out.println("qualifier = " + Bytes.toString(CellUtil.cloneQualifier(cell)));

            }

        }

    }

　　RegexStringComparator("^00004")正则计较器，支持正则表达式。过滤rowkey是以‘’00004‘开头的行。

HBase第三章过滤器的更多相关文章

HBase in Action前三章笔记
近期接触HBase,看了HBase In Action的英文版.開始认为还行,做了些笔记.可是兴许看下去,越来越感觉到实战这本书比較偏使用上的细节,对于HBase的具体设计涉及得很少.把前三章的一些笔 ...
Hbase学习（三）过滤器 java API
Hbase学习(三)过滤器 HBase 的基本 API,包括增.删.改.查等. 增.删都是相对简单的操作,与传统的 RDBMS 相比,这里的查询操作略显苍白,只能根据特性的行键进行查询(Get)或者根 ...
《Django By Example》第三章中文翻译（个人学习，渣翻）
书籍出处:https://www.packtpub.com/web-development/django-example 原作者:Antonio Melé (译者注:第三章滚烫出炉,大家请不要吐槽文中 ...
精通Web Analytics 2.0 （5）第三章：点击流分析的奇妙世界：指标
精通Web Analytics 2.0 : 用户中心科学与在线统计艺术第三章:点击流分析的奇妙世界:指标新的Web Analytics 2.0心态:搞定它.新的闪亮系列工具:是的.准备好了吗?当然 ...
Mysql技术内幕-笔记-第三章查询处理
第三章查询处理逻辑查询处理:(8) SELECT (9) DISTINCT <select_list> (1) FROM <left_table> (3) <join ...
第三章Hibernate关联映射
第三章Hibernate关联映射一.关联关系类与类之间最普通的关系就是关联关系,而且关联是有方向的. 以部门和员工为列,一个部门下有多个员工,而一个员工只能属于一个部门,从员工到部门就是多对一关联 ...
CentOS 7.4 初次手记：第三章 CentOS基础了解
第三章 CentOS基础了解... 36 第一节语言编码.终端... 36 I 查看语言编码... 36 II Tty?.pts/?. 36 第二节 bash/sh command. 38 I 查找 ...
[转]TEC1401.Report开发技术总结 - 第三章使用Oracle Reports开发报表-创建一个分组报表（2/4）
本文转自:http://blog.csdn.net/deepsea_allen/article/details/53900284 第三章创建一个分组报表 1. 建立数据模型数据模型用于 ...
CentOS6安装各种大数据软件第三章：Linux基础软件的安装
相关文章链接 CentOS6安装各种大数据软件第一章:各个软件版本介绍 CentOS6安装各种大数据软件第二章:Linux各个软件启动命令 CentOS6安装各种大数据软件第三章:Linux基础 ...

随机推荐

SVM中为何间隔边界的值为正负1
在WB二面中,问到让讲一下SVM算法. 我回答的时候,直接答道线性分隔面将样本分为正负两类,取平行于线性切割面的两个面作为间隔边界,分别为:wx+b=1和wx+ b = -1. 面试官就问,为什么是正 ...
QTP基本方法
1.for循环: m代表间隔循环长度: 如果m>0,则j要大于i: 如果m<0,则i要大于j: for i to j [step m] 语句块 [exit for]//强制退出循环 nex ...
Altium 技巧记录
1.隐藏全部网络,即隐藏全部的飞线,便于布局,在 PCB 编辑器下,选择工具→连接→显示或隐藏全部网络即可 2.元器件非常多时,模块化布局的小技巧,参考:Altium Designer(DXP)小技巧 ...
ActionBar自己定义改动无效解决方法
假设程序支持API11下面的版本号,那么须要改动多个地方 values-v14 和values-v11以下的styles中也要写上 <style name="AppTheme" ...
Java I/O系列（二）ByteArrayInputStream与ByteArrayOutputStream源码分析及理解
1. ByteArrayInputStream 定义继承了InputStream,数据源是内置的byte数组buf,那read ()方法的使命(读取一个个字节出来),在ByteArrayInputS ...
plsql developer 64位注册码
注册码product code(产品编码): 4vkjwhfeh3ufnqnmpr9brvcuyujrx3n3le serial Number(序列号):226959 password(口令): xs ...
linux下启动和终止JAVA程序shell脚本
1.启动脚本start.sh #run application backgroud nohup java -jar chess-admin->& & #record the pr ...
快速提高谷歌浏览器(Chrome)自带下载器的网速
之前每次下载东西都是复制好下载链接到迅雷中下载,会提高成倍网速,但是时间一长,感觉不方便,废话不多说,上干货~ 由于中国防火墙(GFW)的强大,在线下载Google浏览器的时候速度非常慢,如果只是单独 ...
TF-IDF介绍
TF-IDF是什么 TF-IDF是一种统计方法,用以评估一个词对于一篇文章或语料库中一篇文章的重要性.字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降. T ...
HIve数据存储
表 Table 内部表 Partition 分区表 External Table 外部表 Bucket Table 桶表内部表分区表 parttion对应于数据库中的Partition列的密集索引 ...

HBase第三章 过滤器

1 列值过滤器

2 列名前缀过滤器

3 多个列值前缀过滤器

4 rowKey过滤器

HBase第三章 过滤器的更多相关文章

随机推荐

热门专题

HBase第三章过滤器

4 rowKey过滤器　　

HBase第三章过滤器的更多相关文章