Hadoop下MapReduce实现Pi值的计算

Hadoop自带的例子中，有一个计算Pi值的例子。

这个程序的原理是这样的。假如有一个边长为1的正方形。以正方形的一个端点为圆心，以1为半径，画一个圆弧，于是在正方形内就有了一个直角扇形。在正方形里随机生成若干的点，则有些点是在扇形内，有些点是在扇形外。正方形的面积是1，扇形的面积是0.25*Pi。设点的数量一共是n，扇形内的点数量是nc，在点足够多足够密集的情况下，会近似有nc/n的比值约等于扇形面积与正方形面积的比值，也就是nc/n= 0.25*Pi/1，即Pi = 4*nc/n。

在正方形内生成的样本点越多，计算Pi值越精确，这样，这个问题就很适合用Hadoop来处理啦。假设要在正方形内生成1000万个点，可以设置10个Map任务，每个Map任务处理100万个点，也可以设置100个Map任务，每个Map任务处理10万个点。

package mapreduce1;

/*

 *  @create by 刘大哥

 *  2019年9月3日

   *       利用MapReduce计算pi值

 * */

import java.io.IOException;

import java.util.StringTokenizer;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import PI.Pi;  

    public class WordCount {

        public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {

            Job job = Job.getInstance();

            job.setJobName("WordCount");

            job.setJarByClass(WordCount.class);

            job.setMapperClass(doMapper.class);

            job.setReducerClass(doReducer.class);

            job.setOutputKeyClass(Text.class);

            job.setOutputValueClass(IntWritable.class);

            Path in = new Path("hdfs://192.168.100.129:9000/user/hadoop/p1i.txt");   //输入路径

            Path out = new Path("hdfs://192.168.100.129:9000/user/hadoop/out_pi1");  //输出路径

            FileInputFormat.addInputPath(job, in);

            FileOutputFormat.setOutputPath(job, out);

            System.exit(job.waitForCompletion(true) ?  : );

        }

        public static class doMapper extends Mapper<Object, Text, Text, IntWritable>{

            private static final IntWritable one = new IntWritable();

            @Override

            protected void map(Object key, Text value, Context context) throws IOException, InterruptedException {

                String line =  value.toString();

                String word = line.toString();         //读取每个map的数值

                //System.out.println(word);

                int num = Integer.parseInt(word);      //转化为int类型

                //System.out.println(num);

                int[] base = {,};

                Pi test = new Pi(base);

                int a= ;         // 是否在扇形区域内的标志符  1：在扇形区域内 2：不在扇形区域内

                int count = ;  // 统计在扇形区域内点的个数

                for(int x = ; x < num; x++){

                    double[] t = test.getNext();

                    if(t[]*t[]+t[]*t[]<) {  //在扇形区域内

                        a=;

                        count++;                 //在扇形区域内的个数加+

                    }

                    else {                       //不在扇形区域内

                        a=;

                    }

                }

                double result= count*4.00000000/num;    //每个map计算出pi的值

                String strresule = String.valueOf(result);

                Text textresult = new Text();              /*转换类型为Text */

                textresult.set(strresule);

                context.write(textresult, one);         //写入

            }

        }

        public static class doReducer extends Reducer<Text, IntWritable, Text, IntWritable>{   //reduce 整合输出

            private IntWritable result = new IntWritable();

            @Override

            protected void reduce(Text key, Iterable<IntWritable> values, Context context)

            throws IOException, InterruptedException {

            int sum = ;

            for (IntWritable value : values) {

                sum += value.get();

            }

                result.set(sum);

                context.write(key, result);

            }

        }

    }

Hadoop下MapReduce实现Pi值的计算的更多相关文章

Mapreduce案例之Pi值估算
题目: 这个程序的原理是这样的.假如有一个边长为1的正方形.以正方形的一个端点为圆心,以1为半径,画一个圆弧,于是在正方形内就有了一个直角扇形.在正方形里随机生成若干的点,则有些点是在扇形内,有些点是 ...
从Hadoop骨架MapReduce在海量数据处理模式（包括淘宝技术架构）
从hadoop框架与MapReduce模式中谈海量数据处理前言几周前,当我最初听到,以致后来初次接触Hadoop与MapReduce这两个东西,我便稍显兴奋,认为它们非常是神奇.而神奇的东西常能勾 ...
Mapreduce求气温值项目
Mapreduce前提工作简单的来说map是大数据,reduce是计算<运行时如果数据量不大,但是却要分工做这就比较花时间了> 首先想要使用mapreduce,需要在linux中进行一些 ...
Hadoop基础-MapReduce的工作原理第二弹
Hadoop基础-MapReduce的工作原理第二弹作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.Split(切片) 1>.MapReduce处理的单位(切片) 想必 ...
Hadoop基础-MapReduce的工作原理第一弹
Hadoop基础-MapReduce的工作原理第一弹作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 在本篇博客中,我们将深入学习Hadoop中的MapReduce工作机制,这些知识 ...
Hadoop 新 MapReduce 框架 Yarn 详解【转】
[转自:http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop-yarn/] 简介: 本文介绍了 Hadoop 自 0.23.0 版本 ...
Hadoop解析--MapReduce
从本篇博客開始咱们一起来具体了解Hadoop的每一个部分.我们在上篇博客中介绍了HDFS,MapReduce,MapReduce为了更有效率事实上是建立在HDFS之上的.有了分布式的文件系统,我们就能 ...
hadoop的mapReduce和Spark的shuffle过程的详解与对比及优化
https://blog.csdn.net/u010697988/article/details/70173104 大数据的分布式计算框架目前使用的最多的就是hadoop的mapReduce和Spar ...
hadoop之mapreduce详解（进阶篇）
上篇文章hadoop之mapreduce详解(基础篇)我们了解了mapreduce的执行过程和shuffle过程,本篇文章主要从mapreduce的组件和输入输出方面进行阐述. 一.mapreduce ...

随机推荐

后缀数组 LCP--模板题
题意: 给你S串和T串,用T串的所有前缀去匹配S串(匹配值是最长公共子串). 问你总值相加是多少. 思路: 先把两个S,T串倒过来,再拼接 S#T 合成一串,跑一下后缀数组在排序好的rank里计算每 ...
后缀数组练习4：Life Forms
有一个细节不是特别懂,然后的话细节有点多,就是挺难发现的那一种,感谢大佬的博客 1470: 后缀数组4:Life Forms poj3294 时间限制: 1 Sec 内存限制: 128 MB提交: ...
百度音乐接口api
百度音乐接口百度音乐全接口 http://tingapi.ting.baidu.com/v1/restserver/ting 请求方式:GET 参数处理:format=json&calb ...
log4j rootLogger配置示例（log4j.properties）
log4j.rootLogger=INFO,commonLogger, log4j.appender.commonLogger=org.apache.log4j.ConsoleAppenderlog4 ...
TIPTOP之分割split函数方法、getIndexOf、subString、replace、临时表创建；
范例(cnmq001): 原:每次查询都把数据全部查询到临时表后再筛选: 现:查询到临时表的时候,增加可行的筛选条件,再二次筛选临时表的数据,进行优化: 1)临时表创建: PRIVATE FUNCTI ...
Jmeter之JDBC取样器（数据库增删改查）
1.将数据库的jar包存入jmeter/lib目录下 2.配置jmeter 测试计划中“添加jar包” 数据库访问配置:线程组->添加->配置原件->JDBC Connection ...
js变量声明提升
1.变量提升根据javascript的运行机制和javascript没有块级作用域这个特点,可以得出,变量会声明提升移至作用域 scope (全局域或者当前函数作用域) 顶部的. 变量声明提升至全局 ...
【原创】Linux基础之重定向stdout/stderr
启动进程后查看日志(stdout和stderr) 1 nohup+tail # nohup $cmd > /path/to/file 2>&1 & # tail -f /p ...
centos 配置rsync+inotify数据实时同步
何为rsync? 定义: rsync是一个开源的快速备份工具,可以在不同主机之间镜像同步整个目录树,支持增量备份,保持链接和权限,非常适用于异地备份何为源端和发起端? 在远程同步过程中,负责发起rs ...
Spark 源码和应用开发环境的构建
引言 Spark 现在无疑是大数据领域最热门的技术之一,读者很容易搜索到介绍如何应用 Spark 技术的文章,但是作为开发人员,在了解了应用的概念之后,更习惯的是打开开发环境,开发一些应用来更深入的学 ...

Hadoop下MapReduce实现Pi值的计算

Hadoop下MapReduce实现Pi值的计算的更多相关文章

随机推荐

热门专题