Spark的运行模式(1)--Local和Standalone】的更多相关文章

Spark一共有5种运行模式:Local,Standalone,Yarn-Cluster,Yarn-Client和Mesos. 1. Local Local模式即单机模式,如果在命令语句中不加任何配置,则默认是Local模式,在本地运行.这也是部署.设置最简单的一种模式 2. Standalone Standalone是Spark自身实现的资源调度框架.如果我们只使用Spark进行大数据计算,不使用其他的计算框架(如MapReduce或者Storm)时,就采用Standalone模式. Stan…
版权声明:本文为原创文章,未经允许不得转载. 复习内容: Spark中Task的提交源码解读 http://www.cnblogs.com/yourarebest/p/5423906.html SchedulerBackend是一个trait,它配合TaskSchedulerImpl共同完成Task调度.执行.资源的分配等.它的子类如下所示,不同的子类对应的不同Spark不同的资源分配调度.详见图1. 图1 SchedulerBackend子类继承图 Spark中不同(集群)模式进行资源的分配是…
Spark的运行模式是多种多样的,那么在这篇博客中谈一下Spark的运行模式 一:Spark On Local 此种模式下,我们只需要在安装Spark时不进行hadoop和Yarn的环境配置,只要将Spark包解压即可使用,运行时Spark目录下的bin目录执行bin/spark-shell即可 具体可参考这篇博客:http://blog.csdn.net/happyanger6/article/details/47070223 二:Spark On Local Cluster(Spark St…
前两篇介绍了Spark的yarn client和yarn cluster模式,本篇继续介绍Spark的STANDALONE模式和Local模式. 下面具体还是用计算PI的程序来说明,examples中该程序有三个版本,分别采用Scala.Python和Java语言编写.本次用Java程序JavaSparkPi做说明. package org.apache.spark.examples; import org.apache.spark.api.java.JavaRDD; import org.ap…
1.测试或实验性质的本地运行模式(单机) 该模式被称为Local[N]模式,是用单机的多个线程来模拟Spark分布式计算,通常用来验证开发出来的应用程序逻辑上是否有问题. 其中N代表可以使用N个线程,每个线程拥有一个core.如果不指定N,则默认是1个线程(该线程有1个core). 如果是local[*],则代表 Run Spark locally with as many worker threads as logical cores on your machine.(在本地运行Spark,在…
Spark集群搭建 local本地模式 下载安装包解压即可使用,测试(2.2版本)./bin/spark-submit --class org.apache.spark.examples.SparkPi --master local[1] ./examples/jars/spark-examples_2.11-2.2.0.jar 100 local[1]:1代表线程数100:spark类中需要的一个参数,越大计算的越准 集群搭建过程中,基本上是哪台机器上有datanode,就在哪台机器上装一个s…
1.关于mapreduce on yarn 来提交job的流程 yarn=resourcemanager(RM)+nodemanager(NM) client向RM提交任务 RM向NM分配applicationMaster(AM),并找到有一个容器,生成一个MR app mstr MR app mstr向RM申请资源 在NM容器中找到MR app mstr,启动开来 MR app mstr监控和调度TASK的运行 MR app mstr向RM提交信息 2.配置 将Hadoop的配置文件添加到Sp…
3. Yarn-Cluster Yarn是一种统一资源管理机制,可以在上面运行多种计算框架.Spark on Yarn模式分为两种:Yarn-Cluster和Yarn-Client,前者Driver运行在Worker节点,后者Driver运行在Client节点上.采用Spark on Yarn模式,只需要在一个节点部署Spark就行了,因此部署比较简单. 先介绍一下Yarn-Cluster. 首先把spark-assembly-1.6.0-hadoop2.6.0.jar上传到HDFS. 由于Ya…
在对nutch源代码运行ant runtime后,会创建一个runtime的目录,在runtime目录下有deploy和local 2个目录. [jediael@jediael runtime]$ ls deploy  local 这2个目录分别代表nutch的2种运行方式:部署模式及本地模式. 1.nutch.sh中关于2种运行方式的执行 if $local; then # fix for the external Xerces lib issue with SAXParserFactory…
1.local(本地模式) 单机模式,通常用来测试 将spark应用以多线程方式,直接运行在本地 本地模式可以启动多个executor不过上限不能超过cpu数 2.standalone(独立模式) 独立运行在一个集群上 由master和slave组成控制executor的运行 3.YARN 运行在资源管理系统上, 由resourcemanager和nodemanager组成控制executor的运行…