使用MapReduce将HDFS数据导入到HBase（一）

package com.bank.service;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.conf.Configured;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.io.ImmutableBytesWritable;
import org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;
import org.apache.hadoop.util.GenericOptionsParser;
import org.apache.hadoop.util.Tool;
import org.apache.hadoop.util.ToolRunner;

/**
* 使用MapReduce批量导入Hbase（没有Reduce函数的MapReduce）
* @author mengyao
*
*/
public class DataImportToHbase extends Configured implements Tool {

static class DataImportToHbaseMapper extends Mapper<LongWritable, Text, ImmutableBytesWritable, Put> {
       private static String familyName = "info";
       private static String[] qualifiers = {"gzh", "currency", "version", "valuta", "qfTime", "flag", "machineID"};
       @Override
       protected void map(LongWritable key, Text value, Context context)
               throws IOException, InterruptedException {
           String line = value.toString();
           String[] values = line.split("\t");
           if (values.length == 7 && values.length == qualifiers.length) {
               String row = values[0]+"_"+values[1]+"_"+values[2]+"_"+values[3];
               long timestamp = System.currentTimeMillis();
               ImmutableBytesWritable immutable = new ImmutableBytesWritable(Bytes.toBytes(row));
               Put put = new Put(Bytes.toBytes(row));
               for (int i = 0; i < values.length; i++) {
                   String qualifier = qualifiers[i];
                   String val = values[i];
                   put.add(Bytes.toBytes(familyName), Bytes.toBytes(qualifier), timestamp, Bytes.toBytes(val));
               }
               context.write(immutable, put);
           } else {
               System.err.println(" ERROR: value length must equale qualifier length ");
           }
       }
   }

@Override
   public int run(String[] arg0) throws Exception {
       Job job = Job.getInstance(getConf(), DataImportToHbase.class.getSimpleName());
       job.setJarByClass(DataImportToHbase.class);

       job.setInputFormatClass(TextInputFormat.class);
       FileInputFormat.setInputPaths(job, new Path(arg0[0]));

       job.setMapperClass(DataImportToHbaseMapper.class);
       job.setMapOutputKeyClass(ImmutableBytesWritable.class);
       job.setMapOutputValueClass(Put.class);

       TableMapReduceUtil.initTableReducerJob(arg0[1], null, job);
       job.setNumReduceTasks(0);
       TableMapReduceUtil.addDependencyJars(job);

       return job.waitForCompletion(true) ? 0 : 1;
   }

   public static void main(String[] args) throws Exception {
       Configuration conf = HBaseConfiguration.create();
       conf.set("hbase.zookeeper.quorum", "h5:2181,h6:2181,h7:2181");
       conf.set("hbase.zookeeper.property.clientPort", "2181");
       conf.set("dfs.socket.timeout", "3600000");
       String[] otherArgs = new GenericOptionsParser(args).getRemainingArgs();
       if (otherArgs.length != 2) {
           System.err.println(" ERROR: <dataInputDir> <tableName>");
           System.exit(2);
       }
       int status = ToolRunner.run(conf, new DataImportToHbase(), otherArgs);
       System.exit(status);
   }
}

使用MapReduce将HDFS数据导入到HBase（一）的更多相关文章

使用MapReduce将HDFS数据导入到HBase（二）
package com.bank.service; import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.conf. ...
使用MapReduce将HDFS数据导入到HBase（三）
使用MapReduce生成HFile文件,通过BulkLoader方式(跳过WAL验证)批量加载到HBase表中 package com.mengyao.bigdata.hbase; import j ...
使用MapReduce将HDFS数据导入Mysql
使用MapReduce将Mysql数据导入HDFS代码链接将HDFS数据导入Mysql,代码示例 package com.zhen.mysqlToHDFS; import java.io.DataI ...
使用MapReduce将mysql数据导入HDFS
package com.zhen.mysqlToHDFS; import java.io.DataInput; import java.io.DataOutput; import java.io.IO ...
用mapreduce读取hdfs数据到hbase上
hdfs数据到hbase过程将HDFS上的文件中的数据导入到hbase中实现上面的需求也有两种办法,一种是自定义mr,一种是使用hbase提供好的import工具 hbase先创建好表 cre ...
HBase(三): Azure HDInsigt HBase表数据导入本地HBase
目录: hdfs 命令操作本地 hbase Azure HDInsight HBase表数据导入本地 hbase hdfs命令操作本地hbase: 参见 HDP2.4安装(五):集群及组件安装 , ...
HBase结合MapReduce批量导入（HDFS中的数据导入到HBase）
HBase结合MapReduce批量导入 package hbase; import java.text.SimpleDateFormat; import java.util.Date; import ...
把hdfs数据写入到hbase表
功能:把hdfs上的数据写入到hbase表. hadoop的mapreduce输出要导入到hbase表,最好先输出HFile格式,再导入hbase,因为HFile是hbase的内部存储格式,所以导入效 ...
sqoop将关系型的数据库得数据导入到hbase中
1.sqoop将关系数据库导入到hbase的参数说明

随机推荐

关于虚拟继承类的大小问题探索，VC++ 和 G++ 结果是有区别的
昨天笔试遇到个关于类占用的空间大小的问题,以前没怎么重视,回来做个试验,还真发现了问题,以后各位笔试考官门,出题时请注明是用什么编译器. vc6/vc8 cl 和 Dev-C 的g++ 来做的测试: ...
MSSQL row_number简单使用语法
MSSQL row_number简单使用语法 select * from ( select row_number() over(partition by threadid order by date ...
Java基础知识强化95：Calendar类之Calendar类的add()和set()方法
1. Calendar的add()和set()方法: public void add(int field,int amount):根据给定的日历字段和对应的时间,来对当前的日历进行操作 public ...
Android事件的分发机制
在分析Android事件分发机制前,明确android的两大基础控件类型:View和ViewGroup.View即普通的控件,没有子布局的,如Button.TextView. ViewGroup继承自 ...
css动画+滚动的+飞舞的小球
源代码如下: <!DOCTYPE html><html><head> <title>xi</title> <meta charset= ...
解决 jsp eclipse异常【The import javax.servlet cannot be resolved】
[ <%@taglib prefix="c" uri="http://java.sun.com/jsp/jstl/core"%> 报错][impor ...
asp.net中应用JQuery.pagination分页
JQuery.pagination这款分页控件非常好用,可实现无刷新分页,为了方便下次做项目便于拷贝,所以在此发布一下,具体的实现流程如下: 效果图: JQuery.pagination的各个参数的说 ...
Maven构建SSM架构，并分离层次，使用Maven 组织多项目
参考http://www.cnblogs.com/quanyongan/archive/2013/05/28/3103243.html一步一步搭建,感谢QuantSeven 1.建好的目录结构说明: ...
PHP E-mail
PHP E-mail 注入首先,请看上一章中的 PHP 代码: <html><body> <?phpif (isset($_REQUEST['email']))//if ...
css样式-ime-mode text-transform
今天遇到一个新的css样式: ime-mode text-transform 有效小作用取值:auto : 默认值.不影响ime的状态.与不指定 ime-mode 属性时相同 active : ...

使用MapReduce将HDFS数据导入到HBase（一）

使用MapReduce将HDFS数据导入到HBase（一）的更多相关文章

随机推荐

热门专题