读取hbase数据到mysql

先写一个自己的MyRecordWriter类 extends RecordWriter

package calllog;

import java.io.IOException;

import java.sql.Connection;

import java.sql.DriverManager;

import java.sql.SQLException;

import java.sql.Statement;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.RecordWriter;

import org.apache.hadoop.mapreduce.TaskAttemptContext;

public class IRecordWrite extends RecordWriter<Text, IntWritable>{

	@Override

	public void write(Text key, IntWritable value){

		String driver = "com.mysql.jdbc.Driver";

		String url = "jdbc:mysql://192.168.120.110:3306/calllog?characterEncoding=UTF-8";

		String user = "root";

		String password = "******";

		System.out.println("开始写入数据");

		Connection conn = null;

		Statement statement = null;

		//数据处理

		String string = key.toString();

		String[] split = string.split("\t");

		String zhujian = split[0]+"_"+split[1]+"_"+split[2];

		try {

			Class.forName(driver);

			conn = DriverManager.getConnection(url, user, password);

			conn.setAutoCommit(true);

			statement = conn.createStatement();

			//有则更新，无则插入

			//INSERT INTO `tb_call` (`id_date_contact`, `id_date_dimension`, `id_contact`, `call_sum`, `call_duration_sum`) VALUES (?, ?, ?, ?, ?) ON DUPLICATE KEY UPDATE `id_date_contact` = ?;

			String sql = "INSERT INTO mylog values ('"+zhujian+"','"+split[0]+"','"+split[1]+"','"+split[2]+"','"+value.toString()+"') ON DUPLICATE KEY UPDATE name_phone_time = '"+zhujian+"';";

			System.out.println(sql);

			statement.execute(sql);

			System.err.println("---------插入成功！--------------------------");

		} catch (ClassNotFoundException e) {

			// TODO Auto-generated catch block

			e.printStackTrace();

		} catch (SQLException e) {

			// TODO Auto-generated catch block

			e.printStackTrace();

		}finally {

			try {

				if (statement!=null) {

					statement.close();

				}

				if (conn!=null) {

					conn.close();

				}

			} catch (SQLException e) {

				e.printStackTrace();

			}

		}

	}

	@Override

	public void close(TaskAttemptContext context) throws IOException, InterruptedException {

		// TODO Auto-generated method stub

	}

}

再写一个自己的outputFormat extends OutputFormat

package calllog;

import java.io.IOException;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.JobContext;

import org.apache.hadoop.mapreduce.OutputCommitter;

import org.apache.hadoop.mapreduce.OutputFormat;

import org.apache.hadoop.mapreduce.RecordWriter;

import org.apache.hadoop.mapreduce.TaskAttemptContext;

public class IOutputFormat extends OutputFormat<Text, IntWritable>{

	@Override

	public RecordWriter<Text, IntWritable> getRecordWriter(TaskAttemptContext context)

			throws IOException, InterruptedException {

		return new IRecordWrite();

	}

	@Override

	public void checkOutputSpecs(JobContext context) throws IOException, InterruptedException {

	}

	@Override

	public OutputCommitter getOutputCommitter(TaskAttemptContext context) throws IOException, InterruptedException {

		return (new org.apache.hadoop.mapreduce.lib.output.NullOutputFormat<Text, IntWritable>())

				.getOutputCommitter(context);

	}

}

　　最后再driver端自定义自己的输出类

public class Idriver {

	public static void main(String[] args) throws Exception {

		Configuration conf = new Configuration();

		Job job = Job.getInstance(conf);

		job.setJarByClass(Idriver.class);

		// 3 关 联 map

		job.setMapperClass(Imap.class);

		job.setReducerClass(Ireduce.class);

		job.setMapOutputKeyClass(Text.class);

		job.setMapOutputValueClass(IntWritable.class);

		//分区

		//job.setPartitionerClass(IPartitioner.class);

		//job.setNumReduceTasks(4);

		// 4 设置最终输出数据类型

		//job.setOutputKeyClass(Text.class);

		//job.setOutputValueClass(IntWritable.class);

		job.setOutputFormatClass(IOutputFormat.class);

		// 5 设置输入输出路径

		FileInputFormat.setInputPaths(job, new Path(args[0]));

		//FileOutputFormat.setOutputPath(job, new Path(args[1]));

		// 8 提交

		boolean result = job.waitForCompletion(true);

		System.exit(result ? 0 : 1);

	}

}

读取hbase数据到mysql的更多相关文章

关于mapreducer 读取hbase数据存入mysql的实现过程
mapreducer编程模型是一种八股文的代码逻辑,就以用户行为分析求流存率的作为例子 1.map端来说:必须继承hadoop规定好的mapper类:在读取hbase数据时,已经有现成的接口 Tabl ...
使用MapReduce读取HBase数据存储到MySQL
Mapper读取HBase数据 package MapReduce; import org.apache.hadoop.hbase.Cell; import org.apache.hadoop.hba ...
SparkSQL读取HBase数据
这里的SparkSQL是指整合了Hive的spark-sql cli(关于SparkSQL和Hive的整合,见文章后面的参考阅读). 本质上就是通过Hive访问HBase表,具体就是通过hive-hb ...
java的poi技术读取Excel数据到MySQL
这篇blog是介绍java中的poi技术读取Excel数据,然后保存到MySQL数据中. 你也可以在 : java的poi技术读取和导入Excel了解到写入Excel的方法信息使用JXL技术可以在 ...
jxl读写excel, poi读写excel,word, 读取Excel数据到MySQL
这篇blog是介绍: 1. java中的poi技术读取Excel数据,然后保存到MySQL数据中. 2. jxl读写excel 你也可以在 : java的poi技术读取和导入Excel了解到写入Exc ...
Spark 读取HBase数据
Spark1.6.2 读取 HBase 1.2.3 //hbase-common-1.2.3.jar //hbase-protocol-1.2.3.jar //hbase-server-1.2.3.j ...
php+phpspreadsheet读取Excel数据存入mysql
先生成Excel模板,然后导入Excel数据到mysql,每条数据对应图片上传到阿里云 <?php /** * Created by PhpStorm. * User: Administrato ...
通过读取excel数据和mysql数据库数据做对比（二）-代码编写测试
通过上一步,环境已搭建好了. 下面开始实战, 首先,编写链接mysql的函数conn_sql.py import pymysql def sql_conn(u,pwd,h,db): conn=pymy ...
spark读取hbase数据
def main(args: Array[String]): Unit = { val hConf = HBaseConfiguration.create(); hConf.set("hba ...

随机推荐

SAP成都研究院许聚龙：Hello, Coresystems！
Jerry的前一篇文章<SAP成都研究院数字创新空间沟通S/4HANA和C/4HANA的智能服务演示视频和Coresystems分享预告>已经提到,接下来会由SAP成都研究院数字创新空间的 ...
centos 6.6 下yum安装部署zabbix2.4所遇到web安装页面无法打开的问题
nginx配置zabbix下setup.php(web页面)无法显示,浏览器无法打开 1.检查系统是否安装nginx,以便解析html 已安装,安装方式为yum安装,可以解析其他页面 2.php没有完 ...
[POI2008]STA-Station
嘟嘟嘟一道树形dp题. 令dp[u]表示以u为根时所有点的深度之和.考虑u到他的一个子节点v时答案的变化,v子树以外的点的深度都加1,v子树以内的点的深度都减1,所以dp[v] = dp[u] + ...
[19/03/22-星期五] 异常(Exception)(二)_捕获异常
一.概念捕获异常是通过3个关键词来实现的:try-catch-finally.用try来执行一段程序,如果出现异常,系统抛出一个异常,可以通过它的类型来捕捉(catch)并处理它, 最后一步是通过f ...
【luogu P3369 【模板】普通平衡树（Treap/SBT）】模板 Scapegoat Tree
#include <cstdio> #include <cstring> #include <iostream> #include <algorithm> ...
Android学习笔记_70_一个应用程序启动另一个应用程序的Activity
第一种(我自己写的) :之前在网上看来一些,很多不是我要的可以启动另外一个应用程序的主Activity. //这些代码是启动另外的一个应用程序的主Activity,当然也可以启动任意一个Activit ...
An Algorithm for Surface Encoding and Reconstruction From 3D Point Cloud Data
An Algorithm for Surface Encoding and Reconstruction From 3D Point Cloud Data https://www.youtube.co ...
课时57.HTML被废弃的标签（掌握）
1.为什么HTML中有一部分标签会被废弃? 因为当前HTML中的标签只有一个作用,就是用来添加语义,而早期的HTML标签中有一部分标签是没有语义的有一部分标签是用来修改样式的所以这部分标签就被淘汰 ...
18.Shiro与Springboot整合下登陆验证UserService未注入的问题
Shiro与Springboot整合下登陆验证UserService未注入的问题前言: 刚开始整合的情况下,UserService一执行,就会报空指针异常. 看了网上各位大神的讲解,什么不能用ser ...
Shiro 登录认证源码详解
Shiro 登录认证源码详解 Apache Shiro 是一个强大且灵活的 Java 开源安全框架,拥有登录认证.授权管理.企业级会话管理和加密等功能,相比 Spring Security 来说要更加 ...

读取hbase数据到mysql

读取hbase数据到mysql的更多相关文章

随机推荐

热门专题