功能：把hdfs上的数据写入到hbase表。

hadoop的mapreduce输出要导入到hbase表，最好先输出HFile格式，再导入hbase,因为HFile是hbase的内部存储格式，所以导入效率很高，下面我们来看一下具体怎么做。

1、我们在hdfs上有一个文本文件：

2、在hbase表里我们创建一个t1表

　　创建语句：create 't1','cf'

3、写MR作业

 package cn.tendency.wenzhouhbase.hadoop;

 import java.io.IOException;

 import java.text.SimpleDateFormat;

 import java.util.Calendar;

 import org.apache.hadoop.conf.Configuration;

 import org.apache.hadoop.hbase.client.Mutation;

 import org.apache.hadoop.hbase.client.Put;

 import org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil;

 import org.apache.hadoop.hbase.mapreduce.TableOutputFormat;

 import org.apache.hadoop.hbase.mapreduce.TableReducer;

 import org.apache.hadoop.io.LongWritable;

 import org.apache.hadoop.io.NullWritable;

 import org.apache.hadoop.io.Text;

 import org.apache.hadoop.mapreduce.Job;

 import org.apache.hadoop.mapreduce.Mapper;

 import org.apache.hadoop.mapreduce.Reducer;

 import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

 import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;

 public class Hadoop2Hbase {

     @SuppressWarnings("deprecation")

     public static void main(String[] args) throws Exception {

         Configuration conf = new Configuration();

         conf.set("hbase.zookeeper.quorum", "192.168.1.124,192.168.1.125,192.168.1.126");

         conf.set("hbase.zookeeper.property.clientPort", "2181");

         conf.set("hbase.master.port", "60000");

         conf.set("hbase.rootdir", "hdfs://192.168.1.122:9000/hbase");

         conf.set(TableOutputFormat.OUTPUT_TABLE, "t1");

         Job job = new Job(conf, Hadoop2Hbase.class.getSimpleName());

         TableMapReduceUtil.addDependencyJars(job);

         job.setJarByClass(Hadoop2Hbase.class);

         job.setMapperClass(HbaseMapper.class);

         job.setReducerClass(HbaseReducer.class);

         job.setMapOutputKeyClass(LongWritable.class);

         job.setMapOutputValueClass(Text.class);

         job.setInputFormatClass(TextInputFormat.class);

         job.setOutputFormatClass(TableOutputFormat.class);

         FileInputFormat.setInputPaths(job, "hdfs://192.168.1.123:9000/mytest/*");

         job.waitForCompletion(true);

     }

     static class HbaseMapper extends

             Mapper<LongWritable, Text, LongWritable, Text> {

         @Override

         protected void map(LongWritable key, Text value,

                 Mapper<LongWritable, Text, LongWritable, Text>.Context context)

                 throws IOException, InterruptedException {

             SimpleDateFormat sdf = new SimpleDateFormat("yyyyMMddHHmmss");

             String[] split = value.toString().split("\t");

             context.write(

                     key,

                     new Text(split[0]+sdf.format(Calendar.getInstance().getTime())

                             + "\t" + value.toString()));

         }

     }

     static class HbaseReducer extends

             TableReducer<LongWritable, Text, NullWritable> {

         @Override

         protected void reduce(

                 LongWritable key,

                 Iterable<Text> values,

                 Reducer<LongWritable, Text, NullWritable, Mutation>.Context context)

                 throws IOException, InterruptedException {

             for (Text text : values) {

                 String[] split = text.toString().split("\t");

                 Put put = new Put(split[0].getBytes());

                 put.addColumn("cf".getBytes(), "oneColumn".getBytes(), text

                         .toString().getBytes());

                 put.addColumn("cf".getBytes(), "id".getBytes(),

                         split[1].getBytes());

                 put.addColumn("cf".getBytes(), "name".getBytes(),

                         split[2].getBytes());

                 put.addColumn("cf".getBytes(), "age".getBytes(),

                         split[3].getBytes());

 //                put.addColumn("cf".getBytes(), "addr".getBytes(),

 //                        split[4].getBytes());

                 context.write(NullWritable.get(), put);

             }

         }

     }

 }

把hdfs数据写入到hbase表的更多相关文章

hbase使用MapReduce操作4（实现将 HDFS 中的数据写入到 HBase 表中）
实现将 HDFS 中的数据写入到 HBase 表中 Runner类 package com.yjsj.hbase_mr2; import com.yjsj.hbase_mr2.ReadFruitFro ...
Flink 使用（一）——从kafka中读取数据写入到HBASE中
1.前言本文是在<如何计算实时热门商品>[1]一文上做的扩展,仅在功能上验证了利用Flink消费Kafka数据,把处理后的数据写入到HBase的流程,其具体性能未做调优.此外,文中并未就 ...
使用spark将内存中的数据写入到hive表中
使用spark将内存中的数据写入到hive表中 hive-site.xml <?xml version="1.0" encoding="UTF-8" st ...
将从数据库中获取的数据写入到Excel表中
pom.xml文件写入代码,maven自动加载poi-3.1-beta2.jar  & ...
使用MapReduce将HDFS数据导入到HBase（三）
使用MapReduce生成HFile文件,通过BulkLoader方式(跳过WAL验证)批量加载到HBase表中 package com.mengyao.bigdata.hbase; import j ...
Mapreduce读取Hbase表，写数据到一个Hbase表中
public class LabelJob { public static void main(String[] args) throws Exception { Job job = Job.getI ...
使用MapReduce将HDFS数据导入到HBase（二）
package com.bank.service; import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.conf. ...
使用MapReduce将HDFS数据导入到HBase（一）
package com.bank.service; import java.io.IOException; import org.apache.hadoop.conf.Configuration;im ...
Mysql把一个表的数据写入另一个表中
一.表结构一样 insert into 表1 select * from 表2 二. 表结构不一样或者取部分列 insert into 表1 (列名1,列名2,列名3) select 列1,列2,列3 ...

随机推荐

python 之数据库（视图、触发器、事务、存储过程）
10.13 视图 1.什么是视图视图就是通过查询得到一张虚拟表,然后保存下来,下次用的直接使用即可 2.为什么要用视图如果要频繁使用一张虚拟表,可以不用重复查询 3.如何使用视图视图记录的增.删 ...
Python基础 — 数据类型转换
Python 数据类型转换有时候,我们需要对数据内置的内心进行转换,数据类型的转换,你只需要将数据类型作为函数名即可. 以下几个内置的函数可以执行数据类型之间的转换,这些函数返回一个新的对象,表示转 ...
PB之取下来列修改后的值（AcceptText）
AcceptText()功能将“漂浮”在数据窗口控件上编辑框的内容放入到数据窗口控件的当前项中(主缓区中).在将数据放入到当前项之前,编辑框中的数据必须通过有效性规则检查语法 dwcontrol. ...
Spring Boot使用@ConfigurationProperties注解获取配置文件中的属性值
注意:这种方式要提供属性的getter/setter方法—— 如果idea报错,提示没有相应的执行器,就需要在maven中添加: (虽然不配置代码也能正常运行,作用在下面会说明) 配置了该执行器后,在 ...
网页调试js时，如何知道某个事件对应哪段js代码？
有时候我们需要知道某个事件对应的js代码,比如点击一个div元素时,出现下拉框,我想知道这个功能对应的js代码,那就可以按下图操作: 勾选click事件,重新运行,那么就会在每个click事件那里设置 ...
Java 处理异常 9 个最佳实践，你知道几个？
1. 在Finally中清理资源或者使用Try-With-Resource语句使用Finally Java 7的Try-With-Resource语句 2. 给出准确的异常处理信息 3. 记录你所指 ...
Java中@SuppressWarnings（"unchecked"）的作用
J2SE 提供的最后一个批注是 @SuppressWarnings.该批注的作用是给编译器一条指令,告诉它对被批注的代码元素内部的某些警告保持静默. 一点背景:J2SE 5.0 为 Java 语言增加 ...
TCP粘包/拆包（Netty权威指南）
无论是服务端还是客户端,当我们读取或者发送消息的时候,都需要考虑TCP底层的粘包/拆包机制. TCP粘包/拆包 TCP是个“流”协议,所谓流,就是没有界限的一串数据.大家可以想想河里的流水,是连成一片 ...
Hystrix 熔断器
Hystrix 是Netflix开源的一个延迟和容错库,用于隔离访问远程服务,防止出现级联失败一.Hystrix 的定义二.Hystrix 的原理在分布式式系统中应用熔断器后,服务调用方可以自己 ...
Jerry带您了解Restful ABAP Programming模型系列之三：云端ABAP应用调试
Jerry的Restful ABAP Programming模型介绍系列的前两篇文章: 30分钟用Restful ABAP Programming模型开发一个支持增删改查的Fiori应用 Jerry带 ...

把hdfs数据写入到hbase表

功能：把hdfs上的数据写入到hbase表。

把hdfs数据写入到hbase表的更多相关文章

随机推荐

热门专题