hbase使用MapReduce操作3（实现将 fruit 表中的一部分数据，通过 MR 迁入到 fruit

Runner类

实现将 fruit 表中的一部分数据，通过 MR 迁入到 fruit_mr 表中。

package com.yjsj.hbase_mr;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.conf.Configured;

import org.apache.hadoop.hbase.HBaseConfiguration;

import org.apache.hadoop.hbase.client.Put;

import org.apache.hadoop.hbase.client.Scan;

import org.apache.hadoop.hbase.io.ImmutableBytesWritable;

import org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.util.Tool;

import org.apache.hadoop.util.ToolRunner;

import java.io.IOException;

class Fruit2FruitMRRunner extends Configured implements Tool {

    //组装 Job

    public int run(String[] args) throws Exception {

        //得到 Configuration

        Configuration conf = this.getConf();

        //创建 Job 任务

        Job job = Job.getInstance(conf, this.getClass().getSimpleName());

        job.setJarByClass(Fruit2FruitMRRunner.class);

        //配置 Job

        Scan scan = new Scan();

        scan.setCacheBlocks(false);

        scan.setCaching(500);

        //设置 Mapper，注意导入的是 mapreduce 包下的，不是 mapred 包下的，后者是老版本

        TableMapReduceUtil.initTableMapperJob(

                "fruit", //数据源的表名

                scan, //scan 扫描控制器

                ReadFruitMapper.class,//设置 Mapper 类

                ImmutableBytesWritable.class,//设置 Mapper 输出 key 类型

                Put.class,//设置 Mapper 输出 value 值类型

                job);//设置给哪个 JOB //设置 Reducer

        TableMapReduceUtil.initTableReducerJob("fruit_mr", WriteFruitMRReducer.class, job);

        //设置 Reduce 数量，最少 1 个

        job.setNumReduceTasks(1);

        boolean isSuccess = job.waitForCompletion(true);

        if (!isSuccess) {

            throw new IOException("Job running with error");

        }

        return isSuccess ? 0 : 1;

    }

    public static void main(String[] args) throws Exception {

        Configuration conf ;

        conf = HBaseConfiguration.create();

        conf.set("hbase.zookeeper.quorum", "master,node1,node2");

        conf.set("hbase.zookeeper.property.clientPort", "2181");

        conf.set("hbase.master", "master:60000");

        int status = ToolRunner.run(conf, (Tool) new Fruit2FruitMRRunner(), args);

        System.exit(status);

    }

}

Mapper类

 package com.yjsj.hbase_mr;

 import java.io.IOException;

 import org.apache.hadoop.hbase.Cell;

 import org.apache.hadoop.hbase.CellUtil;

 import org.apache.hadoop.hbase.client.Put;

 import org.apache.hadoop.hbase.client.Result;

 import org.apache.hadoop.hbase.io.ImmutableBytesWritable;

 import org.apache.hadoop.hbase.mapreduce.TableMapper;

 import org.apache.hadoop.hbase.util.Bytes;

 public class ReadFruitMapper extends TableMapper<ImmutableBytesWritable, Put> {

     @Override

     protected void map(ImmutableBytesWritable key, Result value, Context context) throws IOException, InterruptedException {

         //将 fruit 的 name 和 color 提取出来，相当于将每一行数据读取出来放入到 Put 对象中。

         Put put = new Put(key.get());

         //遍历添加 column 行

         for (Cell cell:value.rawCells()) {

         //添加/克隆列族:info

             if("info".equals(Bytes.toString(CellUtil.cloneFamily(cell)))){

                 //添加/克隆列：name

                 if("name".equals(Bytes.toString(CellUtil.cloneQualifier(cell)))){

                     //将该列 cell 加入到 put 对象中

                     put.add(cell);

                     //添加/克隆列:color

                 }else if ("color".equals(Bytes.toString(CellUtil.cloneQualifier(cell)))) {

                     //向该列 cell 加入到 put 对象中

                     put.add(cell);

                 }

             }

         }

         //将从 fruit 读取到的每行数据写入到 context 中作为 map 的输出

         context.write(key,put);

     }

 }

Reduce类

package com.yjsj.hbase_mr;

import java.io.IOException;

import org.apache.hadoop.hbase.client.Put;

import org.apache.hadoop.hbase.io.ImmutableBytesWritable;

import org.apache.hadoop.hbase.mapreduce.TableReducer;

import org.apache.hadoop.io.NullWritable;

public class WriteFruitMRReducer extends TableReducer<ImmutableBytesWritable, Put, NullWritable> {

    @Override

    protected void reduce(ImmutableBytesWritable key, Iterable<Put> values, Context context) throws IOException, InterruptedException {

    //读出来的每一行数据写入到 fruit_mr 表中

        for (Put put : values) {

            context.write(NullWritable.get(), put);

        }

    }

}

hbase使用MapReduce操作3（实现将 fruit 表中的一部分数据，通过 MR 迁入到 fruit_mr 表中）的更多相关文章

hbase使用MapReduce操作4（实现将 HDFS 中的数据写入到 HBase 表中）
实现将 HDFS 中的数据写入到 HBase 表中 Runner类 package com.yjsj.hbase_mr2; import com.yjsj.hbase_mr2.ReadFruitFro ...
hbase使用MapReduce操作2（微博表实现）
package com.yjsj.weibo; import java.io.IOException; import java.util.ArrayList; import java.util.Ite ...
hbase使用MapReduce操作1（基本增删改查）
操作代码 import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.*; import org.apach ...
HBase 与 MapReduce 集成
6. HBase 与 MapReduce 集成 6.1 官方 HBase 与 MapReduce 集成查看 HBase 的 MapReduce 任务的执行:bin/hbase mapredcp; 环 ...
Hbase 与mapreduce结合
Hbase和mapreduce结合为什么需要用mapreduce去访问hbase的数据? ——加快分析速度和扩展分析能力 Mapreduce访问hbase数据作分析一定是在离线分析的场景下应用案例 ...
HBase自定义MapReduce
HBase表数据的转移在Hadoop阶段,我们编写的MR任务分别进程了Mapper和Reducer两个类,而在HBase中我们需要继承的是TableMapper和TableReducer两个类. 目 ...
第5章 MapReduce操作
目录 5.1 案例分析:单词计数 1.设计思路 2.程序源代码 3.程序解读 4.程序运行 5.2 案例分析:数据去重 1.设计思路 2.编写程序 3.程序解读 4.程序运行 5.3 案例分析:求平均 ...
HBase(2) Java 操作 HBase 教程
目录一.简介二.hbase-client 引入三.连接操作四.表操作五.运行测试 FAQ 参考文档一.简介在上一篇文章 HBase 基础入门中,我们已经介绍了 HBase 的一些基本概 ...
Mapreduce操作HBase
这个操作和普通的Mapreduce还不太一样,比如普通的Mapreduce输入可以是txt文件等,Mapreduce可以直接读取Hive中的表的数据(能够看见是以类似txt文件形式),但Mapredu ...

随机推荐

adb的一些常用的命令
如果在dos界面想要直接用adb的话,需要将anroidsdk安装目录下的tools和platform-tools以及加入到环境变量path中. 查看当前的设备(包括真机和模拟器):adb devic ...
kubeadmin 部署(centos 7)
安装指定版本docker:# yum list docker-ce --showduplicates | sort -ryum install docker-ce-18.06.1.ce-3.el7vi ...
Ansible 从远程主机添加或删除MySQL数据库
mysql_db - 从远程主机添加或删除MySQL数据库. 概要要求(在执行模块的主机上) 选项例子笔记状态支持概要从远程主机添加或删除MySQL数据库. 要求(在执行模块的主机上) ...
JDA 8.0.0.0小版本升级
一.升级前关服务和进行备份二.开始升级三. 开以下四个服务 1237 四个服务开启后需重新执行SSIS中的startingFP(去掉backupdata 05 importFP) 当以下值为0,代 ...
Spring依赖注入：注解注入
注解注入顾名思义就是通过注解来实现注入, Spring和注入相关的常见注解有Autowired.Resource.Qualifier.Service.Controller.Repository.Com ...
真机IOS8.3以上的文件夹共享
ios8.3以上的版本,苹果规定需要验证身份,将不在默认开启文件共享,但是在实际测试工作中,提取文件是经常需要做的操作,笔者在使用GT采集性能数据后,通过itoos或itunes都无法获得目标app的 ...
【转】HttpApplication的认识与加深理解
原文:http://www.cnblogs.com/whtydn/archive/2009/10/16/1584584.html HttpApplication对象是经由HttpApplication ...
Electronic Trading[z]
This article is to discuss the operation model between Fund Managers(Client) and Broker Firms. They ...
七大排序的个人总结（二）归并排序（Merge
七大排序的个人总结(二) 归并排序(Merge 归并排序(Merge Sort): 归并排序是一个相当“稳定”的算法对于其它排序算法,比如希尔排序,快速排序和堆排序而言,这些算法有所谓的最好与最 ...
laravel的foreach
1.控制器 2.模板

hbase使用MapReduce操作3（实现将 fruit 表中的一部分数据，通过 MR 迁入到 fruit_mr 表中）

hbase使用MapReduce操作3（实现将 fruit 表中的一部分数据，通过 MR 迁入到 fruit_mr 表中）的更多相关文章

随机推荐

热门专题