第2节 mapreduce深入学习：10、手机号码进行分区

需求三：手机号码分区

在需求一的基础上，继续完善，将不同的手机号分到不同的数据文件的当中去，需要自定义分区来实现，这里我们自定义来模拟分区，将以下数字开头的手机号进行分开

135 开头数据到一个分区文件

136 开头数据到一个分区文件

137 开头数据到一个分区文件

138 开头数据到一个分区文件

139 开头数据到一个分区文件

其他分区

注意：

必须到集群上运行，否则报错：

java.lang.Exception: java.io.IOException: Illegal partition for 13726230503 (2)
at org.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:406)
Caused by: java.io.IOException: Illegal partition for 13726230503 (2)

代码（只列出需求一的基础上修改的部分）：

FlowMain:

TextInputFormat.addInputPath(job,new Path(args[0]));

job.setPartitionerClass(FlowPartition.class);

job.setNumReduceTasks(6);

TextOutputFormat.setOutputPath(job,new Path(args[1]));

//    args[0]=/flowCount/in/data_flow.dat
//    args[1]=/flowCount/3partition
// hadoop jar flowCount_partition.jar cn.itcast.demo3.flowCount.FlowMain  /flowCount/in/data_flow.dat /flowCount/3partition

FlowPartition:

package cn.itcast.demo3.flowCount;

import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Partitioner;

public class FlowPartition extends Partitioner<Text,FlowBean>{

    @Override
    public int getPartition(Text text, FlowBean flowBean, int i) {
        String num = text.toString();
        if(num != null ){
            if(num.startsWith("135"))
                return 0;
            else if(num.startsWith("136"))
                return 1;
            else if(num.startsWith("137"))
                return 2;
            else if(num.startsWith("138"))
                return 3;
            else if(num.startsWith("139"))
                return 4;
            else
                return 5;
        }
        return 5;
    }
}

第2节 mapreduce深入学习：10、手机号码进行分区的更多相关文章

第2节 mapreduce深入学习：8、手机流量汇总求和
第2节 mapreduce深入学习:8.手机流量汇总求和例子:MapReduce综合练习之上网流量统计. 数据格式参见资料夹需求一:统计求和统计每个手机号的上行流量总和,下行流量总和,上行总流量 ...
第2节 mapreduce深入学习：4, 5
第2节 mapreduce深入学习:4.mapreduce的序列化以及自定义排序序列化(Serialization)是指把结构化对象转化为字节流. 反序列化(Deserialization)是序列化 ...
第2节 mapreduce深入学习：14、mapreduce数据压缩-使用snappy进行压缩
第2节 mapreduce深入学习:14.mapreduce数据压缩-使用snappy进行压缩文件压缩有两大好处,节约磁盘空间,加速数据在网络和磁盘上的传输. 方式一:在代码中进行设置压缩代码: ...
第2节 mapreduce深入学习：7、MapReduce的规约过程combiner
第2节 mapreduce深入学习:7.MapReduce的规约过程combiner 每一个 map 都可能会产生大量的本地输出,Combiner 的作用就是对 map 端的输出先做一次合并,以减少在 ...
第2节 mapreduce深入学习：6、MapReduce当中的计数器
第2节 mapreduce深入学习:6. MapReduce当中的计数器计数器是收集作业统计信息的有效手段之一,用于质量控制或应用级统计.计数器还可辅助诊断系统故障.如果需要将日志信息传输到map ...
第2节 mapreduce深入学习：2、3
第2节 mapreduce深入学习:2.MapReduce的分区:3.分区案例的补充完成运行实现在MapReduce中,通过我们指定分区,会将同一个分区的数据发送到同一个reduce当中进行处理,例 ...
第2节 mapreduce深入学习：11、maptask运行机制（多看几遍）
mapTask运行机制详解以及mapTask的并行度在mapTask当中,一个文件的切片大小使用默认值是128M,就是跟我们一个block块对应大小一样 MapTask运行的整个过程背下来1.Tex ...
第2节 mapreduce深入学习：15、reduce端的join算法的实现
reduce端的join算法: 例子: 商品表数据 product: pidp0001,小米5,1000,2000p0002,锤子T1,1000,3000 订单表数据 order: pid ...
第2节 mapreduce深入学习：9、手机上行流量排序
还是上次那个例子,需求二:上行流量倒序排序(递减排序) 分析,以需求一的输出数据作为排序的输入数据,自定义FlowBean,以FlowBean为map输出的key,以手机号作为Map输出的value, ...

随机推荐

BZOJ_5343_[Ctsc2018]混合果汁_二分答案+主席树
BZOJ_5343_[Ctsc2018]混合果汁_二分答案+主席树题意:给出每个果汁的价格p,美味度d,最多能放的体积l.定义果汁混合后的美味度为果汁的美味度的最小值. m次询问,要求花费不大于g, ...
[Usaco2009 Dec] 过路费
[题目链接] https://www.luogu.org/problemnew/show/P2966 [算法] SPFA最短路时间复杂度 : O(N ^ 2) [代码] #include<bi ...
vue 组件全局注册和局部注册
全局注册,注册的组件需要在初始化根实例之前注册了组件: 局部注册,通过使用组件实例选项注册,可以使组件仅在另一个组件或者实例的作用域中可用: 全局组件 js Vue.component('tab-ti ...
P3161 [CQOI2012]模拟工厂
传送门先枚举选择哪些订单,然后转为判定是否可行在能完成的情况下肯定是花越多时间提高生产力越优我们设可以有$x$单位时间来提高生产力,那么如果当前离下一个订单的时间为$T$时,这个订单要\ ...
Python unittest基本框架组成（1）
Python的标准库——unittest(可以实现自动化测试框架的搭建) python unittest四大组成“元件”: test fixture(测试脚手架)——测试代码的运行环境,指测试准备前和 ...
_bzoj1497 [NOI2006]最大获利【最大权闭合子图】
传送门:http://www.lydsy.com/JudgeOnline/problem.php?id=1497 保存最大流模版. 选一个用户群,就必须要选对应的两个中转站,这种关系类似“最大全闭合子 ...
实现字符串的查找和替换分类： c/c++ 2014-10-09 22:33 469人阅读评论(0) 收藏
在字符串中查找目标字符串并将其替换为指定字符串,返回替换的次数.接口为 int find_str_replace(char *&str,const char *find_str,const c ...
IOS应用开发版本控制工具之Versions使用，iosversions
Versions版本控制工具破解版(Versions.zip)下载请见本博文附件.下载后在MAC安装完以后,图标是莲花状.见下图: 双击运行如下图: 点击Repository,连接SVN服务器R ...
RabbitMQ四：生产者--队列--消费者
AMQP协议的梳理和名词解析建议先把上篇AMQP协议先看一遍,理解一下,由于用XMind绘图,电脑屏幕比较小,不能截取全部,如果想要全图和源代码,请下面留言....... 可以点击图片,打开到新的 ...
外文翻译《How we decide》赛场上的四分卫第二节
本书导言翻译本章第一节 "决定是如何做出来的",关于意识最神秘的问题之一.尽管我们时刻做着决定,但是我们没有感觉到大脑内部的一系列有关进程.NFL球探挑选候选球员的评分表中,决策 ...

第2节 mapreduce深入学习：10、手机号码进行分区

需求三：手机号码分区

第2节 mapreduce深入学习：10、手机号码进行分区的更多相关文章

随机推荐

热门专题