spark读取hbase数据

def main(args: Array[String]): Unit = {

      val hConf = HBaseConfiguration.create();

      hConf.set("hbase.zookeeper.quorum","m6,m7,m8")

      val tableName = "t_person"

      hConf.set(TableInputFormat.INPUT_TABLE, tableName)

      val hAdmin = new HBaseAdmin(hConf)

      val conf = new SparkConf()

      conf.set("spark.master", "local")

      conf.set("spark.app.name", "spark demo")

      val sc = new SparkContext(conf);

      val rs = sc.newAPIHadoopRDD(hConf, classOf[TableInputFormat], classOf[ImmutableBytesWritable], classOf[Result])

      rs.foreach(x => {

        println(Bytes.toString(x._2.getRow))

        // 通过列族和列名获取列

        println(Bytes.toInt(x._2.getValue("base_info".getBytes, "age".getBytes)))

      })

  }

　保存数据到hbase数据库中

def main(args: Array[String]): Unit = {

    val conf = new SparkConf()

    conf.set("spark.master", "local")

    conf.set("spark.app.name", "spark demo")

    // 创建SparkSession对象

    val spark = SparkSession.builder().appName("spark sql").config(conf).getOrCreate();

    // 创建sparkContext对象

    val sc = spark.sparkContext

    val hbaseConf = HBaseConfiguration.create()

    val tableName = "t_person"

    hbaseConf.set("hbase.zookeeper.quorum","m6,m7,m8")

    hbaseConf.set(TableInputFormat.INPUT_TABLE, tableName)

    // val hbaseAdmin = new HBaseAdmin(hbaseConf)

    val jobConf = new JobConf(hbaseConf, this.getClass)

    jobConf.setOutputFormat(classOf[TableOutputFormat])

    jobConf.set(TableOutputFormat.OUTPUT_TABLE, tableName)

    val pairs = sc.parallelize(List(("p_0000010", "12")))

    def convert(data : (String, String)) = {

      val p = new Put(Bytes.toBytes(data._1))

      p.add(Bytes.toBytes("base_info"), Bytes.toBytes("age"), Bytes.toBytes(data._2))

      (new ImmutableBytesWritable , p)

    }

    // 保存数据到hbase数据库中

    new PairRDDFunctions(pairs.map(convert)).saveAsHadoopDataset(jobConf)

  }

spark读取hbase数据的更多相关文章

Spark 读取HBase数据
Spark1.6.2 读取 HBase 1.2.3 //hbase-common-1.2.3.jar //hbase-protocol-1.2.3.jar //hbase-server-1.2.3.j ...
SparkSQL读取HBase数据
这里的SparkSQL是指整合了Hive的spark-sql cli(关于SparkSQL和Hive的整合,见文章后面的参考阅读). 本质上就是通过Hive访问HBase表,具体就是通过hive-hb ...
关于mapreducer 读取hbase数据存入mysql的实现过程
mapreducer编程模型是一种八股文的代码逻辑,就以用户行为分析求流存率的作为例子 1.map端来说:必须继承hadoop规定好的mapper类:在读取hbase数据时,已经有现成的接口 Tabl ...
使用MapReduce读取HBase数据存储到MySQL
Mapper读取HBase数据 package MapReduce; import org.apache.hadoop.hbase.Cell; import org.apache.hadoop.hba ...
Spark 读取HBase和SolrCloud数据
Spark1.6.2读取SolrCloud 5.5.1 //httpmime-4.4.1.jar // solr-solrj-5.5.1.jar //spark-solr-2.2.2-20161007 ...
Spark读取Hbase中的数据
大家可能都知道很熟悉Spark的两种常见的数据读取方式(存放到RDD中):(1).调用parallelize函数直接从集合中获取数据,并存入RDD中:Java版本如下: JavaRDD<Inte ...
spark读取hbase形成RDD，存入hive或者spark_sql分析
object SaprkReadHbase { var total:Int = 0 def main(args: Array[String]) { val spark = SparkSession . ...
spark读取hbase(NewHadoopAPI 例子)
package cn.piesat.controller import java.text.{DecimalFormat, SimpleDateFormat}import java.utilimpor ...
spark读取kafka数据 createStream和createDirectStream的区别
1.KafkaUtils.createDstream 构造函数为KafkaUtils.createDstream(ssc, [zk], [consumer group id], [per-topic, ...

随机推荐

Oracle查询实用命令
1.设置每行的长度: SET LIN[ESIZE] 200; 2.设置分页数量: SET PAGES[IZE] 50; 3.查看表空间相关信息: select file_id, tablespace_ ...
如何利用 JConsole观察分析Java程序的运行，进行排错调优
原文链接:http://jiajun.iteye.com/blog/810150 一.JConsole是什么从Java 5开始引入了 JConsole.JConsole 是一个内置 Java 性能 ...
Log4j框架
一.Log4j基本使用方法 Log4j由三个重要的组件构成:日志信息的优先级 Loggers,日志信息的输出目的地 Appenders,日志信息的输出格式 Layouts .日志信息的优先级从高到低 ...
Sharepoint+Office Infopath+快速搭建问卷调查系统
项目背景要开发供公司内部使用的N多个在线调查问卷,要求信息在统一的平台上方便跟踪及管理. 公司内部上了Sharepoint系统及大家习惯了使用infopath及Quick app for share ...
ArrayList数组列表
ArrayList数组列表 Collection接口和List接口的区别 List接口扩充了Collection接口,添加了索引相关的方法. code example Object get(int i ...
JavaScript使用接口
在经典的Java面向对象语言中,可以用关键字interface来定义接口,用implement来实现接口,而JavaScript虽然也是面向对象语言,但是它并没有内置这些,不过由于JavaScript ...
maven 项目打包及window下部署到tomcat
1.maven项目打包 2.将war文件拷贝到tomcat目录webapps下(不要再建目录)3.将必要的jar文件拷贝到tomcat目录libx下 war包或jar 包会生成到项目所在路径的t ...
ADT Ubuntu X64 下ia32-libs替换等【待编辑】
sudo apt-get install ia32-libs apt-get install libglib2.0-0:i386 libpng12-0:i386 libsm6:i386 libxren ...
odoo 人力资源工资计算拓展
默认情况下 odoo工资条的计算只支持一下几种python变量: # payslip: object containing the payslips# employee: hr.employee ob ...
volatile与synchronized的区别
1.锁提供了两种主要特性:互斥(mutual exclusion) 和可见性(visibility). 互斥即一次只允许一个线程持有某个特定的锁,因此可使用该特性实现对共享数据的协调访问协议,这样,一 ...

spark读取hbase数据

保存数据到hbase数据库中

spark读取hbase数据的更多相关文章

随机推荐

热门专题

　保存数据到hbase数据库中