1、Spark 通过api，hfile两种形式获取hbase数据，简单样例

pom内容：

<dependency>

            <groupId>org.apache.hbase</groupId>

            <artifactId>hbase-server</artifactId>

            <version>0.98.6-cdh5.2.0</version>

            <exclusions>

                <exclusion>

                    <artifactId>javax.servlet-api</artifactId>

                    <groupId>javax.servlet</groupId>

                </exclusion>

                <exclusion>

                    <artifactId>javax.servlet</artifactId>

                    <groupId>org.eclipse.jetty.orbit</groupId>

                </exclusion>

                <exclusion>

                    <artifactId>servlet-api-2.5</artifactId>

                    <groupId>org.mortbay.jetty</groupId>

                </exclusion>

                <exclusion>

                    <artifactId>servlet-api</artifactId>

                    <groupId>javax.servlet</groupId>

                </exclusion>

            </exclusions>

        </dependency>

        <dependency>

            <groupId>org.apache.spark</groupId>

            <artifactId>spark-core_2.10</artifactId>

            <version>1.5.2-hdh3.1.0</version>

            <exclusions>

                <exclusion>

                    <artifactId>hadoop-client</artifactId>

                    <groupId>org.apache.hadoop</groupId>

                </exclusion>

            </exclusions>

        </dependency>

        <dependency>

            <groupId>org.apache.spark</groupId>

            <artifactId>spark-sql_2.10</artifactId>

            <version>1.5.2-hdh3.1.0</version>

            <exclusions>

                <exclusion>

                    <artifactId>javax.servlet-api</artifactId>

                    <groupId>javax.servlet</groupId>

                </exclusion>

            </exclusions>

        </dependency>

一、Hbase API获取hbase表数据

 import org.apache.hadoop.conf.Configuration;

 import org.apache.hadoop.hbase.Cell;

 import org.apache.hadoop.hbase.HBaseConfiguration;

 import org.apache.hadoop.hbase.HColumnDescriptor;

 import org.apache.hadoop.hbase.client.HTable;

 import org.apache.hadoop.hbase.client.Result;

 import org.apache.hadoop.hbase.client.ResultScanner;

 import org.apache.hadoop.hbase.client.Scan;

 import org.apache.hadoop.hbase.util.Bytes;

 import java.io.IOException;

 import java.util.List;

 /**

  * 通过HbaseApi获取数据

  */

 public class DataAchieveFromHbaseApi {

     public static void main(String[] args) throws IOException {

         //Hbase配置

         Configuration conf=HBaseConfiguration.create();

         conf.set("hbase.zookeeper.property.clientPort", "2181");//端口

         conf.set("hbase.zookeeper.quorum","hdh1,hdh2,hdh3");//hbase zookeeper地址

         //扫描配置

         Scan scan=new Scan();

         scan.addFamily(Bytes.toBytes("cf"));//列族，可添加多个

         //hbase表

         HTable hTable=new HTable(conf, Bytes.toBytes("test"));//表明

         //获取扫描数据

         ResultScanner rs= hTable.getScanner(scan);

         //hbase表的列族信息

         HColumnDescriptor[] hColDes=hTable.getTableDescriptor().getColumnFamilies();

         for (HColumnDescriptor hColDe : hColDes) {

             System.out.println(Bytes.toString(hColDe.getName()));

         }

         //展示每一行的每一列(这个只有一列)信息

         for (Result r : rs) {

             byte [] bytes= r.getValue(Bytes.toBytes("cf"),Bytes.toBytes("SSID"));//列族和列名

             String str=new String(bytes,"UTF-8");

             if(null!=str&&str.trim().length()>0) {

                 System.out.println(str.trim());

             }

         }

         System.out.println("end<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<");

     }

 }

二、Spark提供接口获取Hbase表数据：

 import org.apache.hadoop.conf.Configuration;

 import org.apache.hadoop.hbase.HBaseConfiguration;

 import org.apache.hadoop.hbase.client.Result;

 import org.apache.hadoop.hbase.io.ImmutableBytesWritable;

 import org.apache.hadoop.hbase.mapreduce.TableInputFormat;

 import org.apache.hadoop.hbase.util.Bytes;

 import org.apache.spark.SparkConf;

 import org.apache.spark.api.java.JavaPairRDD;

 import org.apache.spark.api.java.JavaSparkContext;

 import org.apache.spark.api.java.function.VoidFunction;

 import scala.Tuple2;

 import java.io.IOException;

 /**

  * 通过hfile形式获取数据

  */

 public class DataAchieveFromHfile {

     private static JavaPairRDD<ImmutableBytesWritable, Result> rdd;

     public static void main(String[] args) throws IOException {

         Configuration conf= HBaseConfiguration.create();

         conf.set("hbase.zookeeper.property.clientPort", "2181");

         conf.set("hbase.zookeeper.quorum","hdh1,hdh2,hdh3");

         conf.set(TableInputFormat.INPUT_TABLE, "test");

         SparkConf conf1=new SparkConf().setAppName("test").setMaster("local");//设置spark app名称和运行模式（此为local模式）

         JavaSparkContext sc=new JavaSparkContext(conf1);

         //加载数据

         rdd=sc.newAPIHadoopRDD(conf,TableInputFormat.class, ImmutableBytesWritable.class, Result.class);

         System.out.println("读取数据条数："+rdd.count());

         rdd.foreach(new VoidFunction<Tuple2<ImmutableBytesWritable, Result>>() {

             @Override

             public void call(Tuple2<ImmutableBytesWritable, Result> result) throws Exception {

                 byte [] bytes= result._2().getValue(Bytes.toBytes("cf"), Bytes.toBytes("SSID"));//列族和列名

                 String str= new String(bytes,"UTF-8");

                 if(null!=str&&str.trim().length()>0) {

                     System.out.println(str.trim());

                 }

             }

         });

     }

 }

1、Spark 通过api，hfile两种形式获取hbase数据，简单样例的更多相关文章

Python第十四天序列化 pickle模块 cPickle模块 JSON模块 API的两种格式
Python第十四天序列化 pickle模块 cPickle模块 JSON模块 API的两种格式目录 Pycharm使用技巧(转载) Python第一天安装 shell 文件 Py ...
C++：一般情况下，设计函数的形参只需要两种形式
C++:一般情况下,设计函数的形参只需要两种形式.一,是引用形参,例如 void function (int &p_para):二,是常量引用形参,例如 void function(const ...
jquery插件的两种形式
这里总结一下jquery插件的两种形式,一种是通过字面量的形式组织代码,另一种是通过构造函数的方式.下面就两种形式来分析俩个例子. 例子1: ;(function ($,window,document ...
SQL 关于apply的两种形式cross apply 和 outer apply（转）
转载链接:http://www.cnblogs.com/shuangnet/archive/2013/04/02/2995798.html apply有两种形式: cross apply 和 oute ...
SQL 关于apply的两种形式cross apply 和 outer apply
SQL 关于apply的两种形式cross apply 和 outer apply 例子: CREATE TABLE [dbo].[Customers]( ) COLLATE Chinese_PRC_ ...
SQL关于apply的两种形式cross apply和outer apply（转载）
SQL 关于apply的两种形式cross apply 和 outer apply apply有两种形式: cross apply 和 outer apply 先看看语法: <lef ...
Spark on YARN的两种运行模式
Spark on YARN有两种运行模式,如下 1.yarn-cluster:适合于生产环境. Spark的Driver运行在ApplicationMaster中,它负责向YARN Re ...
在 Perl看来, 字符串只有两种形式. 一种是octets, 即8位序列, 也就是我们通常说的字节数组. 另一种utf8编码的字符串, perl管它叫string. 也就是说: Perl只熟悉两种编
在 Perl看来, 字符串只有两种形式. 一种是octets, 即8位序列, 也就是我们通常说的字节数组. 另一种utf8编码的字符串, perl管它叫string. 也就是说: Perl只熟悉两种编 ...
Controller@实现Controller的两种形式
实现Controller的两种形式形式1:仅仅实现IController接口,自定义Controller对Request的实现.形式2:在实现IController接口以后,继承Controller ...

随机推荐

过滤器压缩全站jsp
过滤器: public class Gzip implements Filter { public void destroy() {} public void doFilter(ServletRequ ...
[Leetcode][019] Remove Nth Node From End of List (Java)
题目在这里: https://leetcode.com/problems/remove-nth-node-from-end-of-list/ [标签] Linked List; Two Pointer ...
window.open窗口居中和窗口最大化
1.window.open()参数 window.open(pageURL,name,parameters) 其中: pageURL为子窗口路径 name为子窗口句柄 parameters为窗口参数( ...
php 练习一 5月5日
练习题一:通过登录者找到他的好友并显示在页面上 <title>无标题文档</title> <style type="text/css"> * { ...
SQL如何查询两个表的数据
在进行查询操作时,我们通常需要查询两个关联表的数据,我们可以使用where语句进行查询,如: select Emp.E_Id,Company.C_OraName from Emp,Company wh ...
Objective-C Http常用API 同步请求与异步请求
开发iOS应用要调用Http接口.获取Http资源,有一套比较成熟的框架ASIHTTPRequest.而我还是比较喜欢使用原始一点的 API,而它跟其他的面向对象语言有许多共通之处.本文分同步请求和异 ...
VMware vSphere 6 Enterprise Plus License
Product: VMware vSphere 6 Enterprise Plus Licensed for 2 physical CPUs (unlimited cores per CPU) Lic ...
Blogger安装最新文章 - Blog透视镜
在Blogger中,是没有最新文章的网页元素,不过倒是有信息提供这个小工具,其实这就是用来新增RSS网摘用的,其中就包含最新文章的Feed,所以只要在小工具中,加入RSS网摘Feed,就可以安装最新文 ...
Lazy Load Plugin for jQuery延迟加载测试成功
一直需要的功能,网页图片太多时对于降低网络流量超有用. 最新的V1.9.3版本其实已不用修改就可以起作用了. 不用网上说的要自己修改代码.
TVS和一般的稳压二极管有什么区别
电压及电流的瞬态干扰是造成电子电路及设备损坏的主要原因,常给人们带来无法估量的损失.这些干扰通常来自于电力设备的起停操作.交流电网的不稳定.雷击干扰及静电放电等,瞬态干扰几乎无处不在.无时不有,使人感 ...

1、Spark 通过api，hfile两种形式获取hbase数据，简单样例

1、Spark 通过api，hfile两种形式获取hbase数据，简单样例的更多相关文章

随机推荐

热门专题