spark streaming插入hbase

import java.sql.{DriverManager, ResultSet}

import org.apache.spark._

import org.apache.spark.streaming._

import scala.util.Random

import org.apache.hadoop.hbase.{HTableDescriptor,HColumnDescriptor,HBaseConfiguration,TableName}

import org.apache.hadoop.hbase.client.{Connection, ConnectionFactory, Put,Table}

object Pi {

  val user="root"

  val password = "root"

  val host="10.8.8.123"

  val database="db_1"

  val port=3306

  val conn_str = "jdbc:mysql://"+host +":"+port+"/"+database

  val tablename="achi"

  val cf="a"

  val qulified="name"

  def CreatTableIfNotFind(conn:Connection,userTable:TableName): Unit ={

    //从Connection获得 Admin 对象(相当于以前的 HAdmin)

    val admin=conn.getAdmin

    if(admin.tableExists(userTable)){

      println("Table exists!")

      //admin.disableTable(userTable)

      //admin.deleteTable(userTable)

      //exit()

    }else{

      val tableDesc=new HTableDescriptor(userTable)

      tableDesc.addFamily(new HColumnDescriptor(cf.getBytes))

      admin.createTable(tableDesc)

      println("Create table success!")

    }

  }

  def InsertHbase(table:Table,cf:String,qulified:String,value:String): Unit ={

    val p=new Put("id001".getBytes())

    p.addColumn(cf.getBytes,qulified.getBytes,value.getBytes)

    table.put(p)

  }

  def main(args: Array[String]) {

    val conf=new SparkConf().setAppName("Spark Streaming").setMaster("local[2]")

    val ssc=new StreamingContext(conf,Seconds(3))

    val lines=ssc.socketTextStream("localhost",9999)

    val words=lines.map(_.split('|'))

    words.print()

    words.foreachRDD{

      rdd=>rdd.foreachPartition{

        pa=>

          val conf=HBaseConfiguration.create()

          val conn=ConnectionFactory.createConnection(conf)

          val userTable=TableName.valueOf(tablename)

          val table=conn.getTable(userTable)

          pa.foreach{

            w=>

              try{

                var beg = System.currentTimeMillis()

                println(w(0)+w(1))

                InsertHbase(table,cf,w(0),w(1))

                println("***************************************************************")

                println(" 耗时: " + (System.currentTimeMillis() - beg)+"ms")

                println("***************************************************************")

              }catch{

                case _:Exception=>println("raw error!")

              }

          }

          table.close()

          conn.close()

      }

    }

    ssc.start()

    ssc.awaitTermination()

  /*

    Class.forName("com.mysql.jdbc.Driver").newInstance();

    val conn1 = DriverManager.getConnection(conn_str,user,password)

    try {

      val statement = conn1.createStatement(ResultSet.TYPE_FORWARD_ONLY, ResultSet.CONCUR_READ_ONLY)

      val rs = statement.executeQuery("select * from achi limit 10")

      while (rs.next) {

        println(rs.getString(1))

      }

    }

    catch {

      case _ : Exception => println("===>")

    }

    finally {

      conn1.close

    }

    */

  }

}

name := "untitled"

version := "1.0"

scalaVersion := "2.10.6"

libraryDependencies++= Seq(

  "mysql" % "mysql-connector-java" % "5.1.38",

  "org.apache.spark" %% "spark-core" % "1.5.2",

  "org.apache.spark" %% "spark-streaming" % "1.5.2",

  "org.apache.hbase" % "hbase-client" % "1.1.3",

  "org.apache.hbase" % "hbase-common" % "1.1.3",

  "org.apache.hbase" % "hbase-server" % "1.1.3"

)

resolvers+="OS China" at "http://maven.oschina.net/content/groups/public/"

spark streaming插入hbase的更多相关文章

Spark Streaming 入门指南
这篇博客帮你开始使用Apache Spark Streaming和HBase.Spark Streaming是核心Spark API的一个扩展,它能够处理连续数据流. Spark Streaming是 ...
基于Kafka+Spark Streaming+HBase实时点击流案例
背景 Kafka实时记录从数据采集工具Flume或业务系统实时接口收集数据,并作为消息缓冲组件为上游实时计算框架提供可靠数据支撑,Spark 1.3版本后支持两种整合Kafka机制(Receiver- ...
Spark Streaming接收Kafka数据存储到Hbase
Spark Streaming接收Kafka数据存储到Hbase fly spark hbase kafka 主要参考了这篇文章https://yq.aliyun.com/articles/60712 ...
日志=>flume=>kafka=>spark streaming=>hbase
日志=>flume=>kafka=>spark streaming=>hbase 日志部分 #coding=UTF-8 import random import time ur ...
Spark Streaming入门
欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文将帮助您使用基于HBase的Apache Spark Streaming.Spark Streaming是Spark API核心的一个扩 ...
【慕课网实战】Spark Streaming实时流处理项目实战笔记二十一之铭文升级版
铭文一级: DataV功能说明1)点击量分省排名/运营商访问占比 Spark SQL项目实战课程: 通过IP就能解析到省份.城市.运营商 2)浏览器访问占比/操作系统占比 Hadoop项目:userA ...
【慕课网实战】Spark Streaming实时流处理项目实战笔记十之铭文升级版
铭文一级: 第八章:Spark Streaming进阶与案例实战 updateStateByKey算子需求:统计到目前为止累积出现的单词的个数(需要保持住以前的状态) java.lang.Illega ...
Spark Streaming 进阶与案例实战
Spark Streaming 进阶与案例实战 1.带状态的算子: UpdateStateByKey 2.实战:计算到目前位置累积出现的单词个数写入到MySql中 1.create table CRE ...
某人视频中提到的 Spark Streaming 优化的几点事项
某人,并未提他的名字,是因为看的视频是1年前的,视频里他吹得厉害.我看视频时,查了一下他在视频里说的要做到的东西,结果上网一查,就看到了很多人说他骗了钱后,就不管交了学费的人了.真假无从查起.但是无风 ...

随机推荐

数据格式转换（一）PDF转换技术
PDF(Portable Document Format)文件格式是Adobe公司开发的电子文件格式. 这样的文件格式与操作系统平台无关.这一特点使它成为在Internet上进行电子文档发行 ...
什么是数学 (R·柯朗 H·罗宾著)
第1章自然数引言 $1 整数的计算 1. 算术的规律 2. 整数的表示 3. 非十进位制中的计算 $2 数学的无限性数学归纳法 1. 数学归纳法原理 2. 等差级数 3. 等比级数 4. 前n项 ...
Day 35数据库（Day1）
创建表. create table student( id int not null auto_increment PRIMARY key, name archar(250) not null, ag ...
IDEA 创建maven项目
说明创建Maven项目的方式:手工创建好处:参考IntelliJ IDEA 14 创建maven项目二(此文章描述了用此方式创建Maven项目的好处)及idea14使用maven创建web工程(此 ...
记一个视频播放器插件 video.js
最近在看扣丁学堂上面的一些视频, 突然对他用的视频播放器有点兴趣, 他也是采用的 ts切片播放, 如果使用传统的video标签是无法实现的他使用的插件叫做 video.js 官网地址官网提供的播放 ...
WEB开发库收集
1. EASYUI http://www.jeasyui.com/ [INTRODUCTION] jQuery EasyUI framework helps you build yo ...
C# 装箱
using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.T ...
overflow标签
有时父标签设置了固定的宽高,但子标签把父标签给撑开了,就要在父标签里加一个overflow标签,等于hidden超出的地方隐藏,等于auto超出的地方隐藏,并且多个滚动条 <div style= ...
system.Data.Entity.Infrastructure.DbUpdateConcurrencyException: Store update, insert, or delete statement affected an unexpected number of rows (0) 问题
页面控件没有做限制.提交后还可以继续点击,造成了在短时间内的多次请求.查看日志两次错误在200ms之内. 错误信息 system.Data.Entity.Infrastructure.DbUpdate ...
Linux学习 LVM ***
一.前言 LVM,逻辑卷管理工具,它的作用是提供一种灵活的磁盘管理办法.通常我们的某个分区用完了,想要扩容,很麻烦.但是用lvm就可以很方便的扩容,收缩. 看它的原理图: 它的原理大致是:首先将磁盘做 ...

spark streaming插入hbase

spark streaming插入hbase的更多相关文章

随机推荐

热门专题