题目

使用HBASE的API实现条件查询功能，具体内容如下：

（1）根据开始时间和结束时间搜索这段时间内的访问记录。输入信息为开始时间和结束时间，用‘|’字符隔开）

（2）根据用户ID搜索该用户的访问记录。输入信息为一个或多个用户ID，用‘|’字符隔开（并）

（3）根据关键字搜索含有该关键字的用户查询词记录。输入信息为一个或多个关键字，用‘|’字符隔开 （交）

（4）根据关键字（如baidu）等搜索相关网站的URL访问记录，输入信息为一个或多个关键字，用‘|’字符隔开（交）

（5）实现以上四个条件任意组合的联合搜索。四个条件之间用’+’字符隔开（联合搜索要求所有条件同时满足）

分析

仔细分析一下这五个题目很像，就是用到了过滤器的知识，代码很类似。

CompareFilter.CompareOp.

LESS  <

LESS_OR_EQUAL <=

EQUAL =

NOT_EQUAL <>

GREATER_OR_EQUAL >=

GREATER >

以（4）为例子

public static void selectURLs(String[] urls) throws IOException {

    //过滤连 MUST_PASS_ALL(and) MUST_PASS_ONE(or)

    FilterList filterList = new FilterList(FilterList.Operator.MUST_PASS_ALL);

    //创建单列值过滤器

    for(String url:urls){

        SingleColumnValueFilter singleColumnValueFilter =

                new SingleColumnValueFilter(Bytes.toBytes("hc"),Bytes.toBytes("URL"),

                        CompareFilter.CompareOp.EQUAL,new SubstringComparator(url));

        //添加到过滤器

        filterList.addFilter(singleColumnValueFilter);

    }

    Table table = HbaseUtils.getTable(Constants.TABLENAME);

    HbaseUtils.showFilter(table,filterList);

    HbaseUtils.close(table);

}

分析一下(5),比较坑的一点就是你可能会想到用split来切割

如果输入条件+1++，最后得到的结果只有1，所以需要循坏字符串来切割

String[] parts={"","","",""};

int cnt = 0;

for(int i=0;i<line.length();i++){

    if(line.charAt(i)!='+'){

        parts[cnt]+=line.charAt(i);

    }else{

        cnt++;

    }

}

第四部分数据搜索之使用HBASE的API实现条件查询的更多相关文章

第六部分数据搜索之使用HBASE的API实现条件查询
题目使用HADOOP的MAPReduce,实现以下功能: (1)基于大数据计算技术的条件查询:使用mapreduce框架,实现类似Hbase六个字段查询的功能 (2)时段流量统计:以hh:mm:ss ...
hbase shell插入根据条件查询数据
hbase shell插入根据条件查询数据创建并插入数据: hbase(main):179:0> create 'scores','grade','course' hbase(main):18 ...
大数据学习系列之三 ----- HBase Java Api 图文详解
版权声明: 作者:虚无境博客园出处:http://www.cnblogs.com/xuwujing CSDN出处:http://blog.csdn.net/qazwsxpcm 个人博客出处:http ...
Hbase API 多条件查询
public static ResultScanner scan(String tableName, String family, List<String> columns, List&l ...
B-树和B+树的应用：数据搜索和数据库索引
B-树和B+树的应用:数据搜索和数据库索引 B-树 1 .B-树定义 B-树是一种平衡的多路查找树,它在文件系统中很有用. 定义:一棵m 阶的B-树,或者为空树,或为满足下列特性的m 叉树:⑴树中每 ...
大数据【七】HBase部署
接着前面的Zookeeper部署之后,现在可以学习HBase了. HBase是基于Hadoop的开源分布式数据库,它以Google的BigTable为原型,设计并实现了具有高可靠性.高性能.列存储.可 ...
大数据时代数据库-云HBase架构&生态&实践
业务的挑战存储量量/并发计算增大现如今大量的中小型公司并没有大规模的数据,如果一家公司的数据量超过100T,且能通过数据产生新的价值,基本可以说是大数据公司了 .起初,一个创业公司的基本思路就是首 ...
jQuery dataTables四种数据来源[转]
2019独角兽企业重金招聘Python工程师标准>>> 四种数据来源对于 dataTables 来说,支持四种表格数据来源. 最为基本的就是来源于网页,网页被浏览器解析为 DOM ...
CRL快速开发框架系列教程四(删除数据)
本系列目录 CRL快速开发框架系列教程一(Code First数据表不需再关心) CRL快速开发框架系列教程二(基于Lambda表达式查询) CRL快速开发框架系列教程三(更新数据) CRL快速开发框 ...

随机推荐

FreeBSD WIFI 配置详细介绍
首先运行ifconfig,看看能不能找到你的网卡,如果能,那么你可以走了﹉﹉﹉﹉﹉﹉﹉﹉﹉﹉﹉﹉﹉﹉﹉﹉﹉﹉﹉﹉运行sysctl net.wlan.devices,他可以告诉你,找到的无线网卡编辑/b ...
sitemesh简单介绍
SiteMesh 是一个网页布局和修饰的框架,利用它可以将网页的内容和页面结构分离,以达到页面结构共享的目的. Sitemesh是由一个基于Web页面布局.装饰以及与现存Web应用整合的框架. 它能帮 ...
Codeforces Round #548 C. Edgy Trees
题面: 传送门题目描述: 给出有n个节点的树,整数k.题目要求找长度为k,符合规则(good序列)的"点序列"(由节点构成的序列)个数有多少?规则如下: 1.走一条出发点为a1, ...
linuxc语言图形化编程包含gtk/gtk.h编译总是报错找不到该文件的解决方法
在编译时输入gcc file.c `pkg-config --libs --cflags gtk+-2.0` 注意`不是单引号,和--前均有一个字符这样问题就结局啦
Vulkan移植GpuImage(二)Harris角点检测与导向滤波
Harris角点检测 UI还是用的上次扣像的,只有前后置可以用,别的没有效果,只看实现就好. 相应源码在实现之前,我先重新整理编译glsl的生成工具,如Harris角点检测中间计算过程需要针对rgb ...
创建数据库 UTF-8
CREATE DATABASE db_name DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;
如何在Google Web Toolkit环境下Getshell
出品|MS08067实验室(www.ms08067.com) 本文作者:大盗贼卡卡 Google Web Toolkit简称(GWT),是一款开源Java软件开发框架.今天这篇文章会介绍如何在这样的环 ...
封装Vue纵向表头左右结构的table表格
我们前端开发人员在使用表格的过程中,大概率碰到的都是表格头部在表格的最上边,然后呈一行展示,紧接着就是表格的每一行的每一个单元格来展示具体内容的场景,很少会遇到表格的头部呈纵向一行展示,也就是说表格的 ...
图像Resize方式对深度学习模型效果的影响
在基于卷积神经网络的应用过程中,图像Resize是必不可少的一个步骤.通常原始图像尺寸比较大,比如常见监控摄像机出来的是1080P高清或者720P准高清画面,而网络模型输入一般没有这么大,像Yolo系 ...
第一次OOP作业-Blog总结
前言第一次作业一共八道题,此次作业也是这三次作业中最接近面向过程程序设计的题目集,整体难度偏低,总耗时1.5h,主要的知识点在熟悉Java的语法上,整体题目的逻辑非常清晰简单,但最后一个判断三角形类 ...

第四部分 数据搜索之使用HBASE的API实现条件查询

题目

分析

第四部分 数据搜索之使用HBASE的API实现条件查询的更多相关文章

随机推荐

热门专题

第四部分数据搜索之使用HBASE的API实现条件查询

第四部分数据搜索之使用HBASE的API实现条件查询的更多相关文章