spark on yarn 集群部署

概述

hadoop2.7.1

spark 1.5.1

192.168.31.62 resourcemanager, namenode, master

192.168.31.63 nodemanager, datanode, worker

192.168.31.64 nodemanager, datanode, worker

Hadoop配置

hadoop-env.sh mapred-env.sh yarn-env.sh至少配置JAVA_HOME

core-site.xml

        <property>

                <name>fs.defaultFS</name>

                <value>hdfs://192.168.31.62:9000</value>

        </property>

        <property>

                <name>hadoop.tmp.dir</name>

                <value>file:/opt/local/hadoop/tmp</value>

        </property>

        <property>

                <name>io.file.buffer.size</name>

                <value></value>

        </property>

        <property>

                <name>hadoop.native.lib</name>

                <value>true</value>

        </property>

hdfs-site.xml

 <property>

                <name>dfs.replication</name>

                <value></value>

        </property>

        <property>

                <name>dfs.namenode.name.dir</name>

                <value>file:/opt/local/hadoop/dfs/name</value>

        </property>

        <property>

                <name>dfs.datanode.data.dir</name>

                <value>file:/opt/local/hadoop/dfs/data</value>

        </property>

        <property>

                <name>dfs.permissions.enabled</name>

                <value>false</value>

        </property>

        <property>

                <name>dfs.namenode.secondary.http-address</name>

                <value>192.168.31.62:</value>

        </property>

mapred-site.xml

 <property>

                <name>mapreduce.framework.name</name>

                <value>yarn</value>

        </property>

yarn-site.xml

    <property>

        <name>yarn.nodemanager.aux-services</name>

        <value>mapreduce_shuffle</value>

    </property>

        <property>

                <name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name>

                <value>org.apache.hadoop.mapred.ShuffleHandler</value>

        </property>

<!--

        <property>

                <name>yarn.resourcemanager.hostname</name>

                <value>192.168.31.62</value>

        </property>

-->

        <property>

                <name>yarn.resourcemanager.resource-tracker.address</name>

                <value>192.168.31.62:</value>

        </property>

        <property>

                <name>yarn.resourcemanager.address</name>

                <value>192.168.31.62:</value>

        </property>

        <property>

        <name>yarn.resourcemanager.scheduler.address</name>

        <value>192.168.31.62:</value>

        </property>

        <property>

                <name>yarn.log-aggregation-enable</name>

                <value>true</value>

        </property>

slaves

slave1

slave2

Spark配置

spark-env.sh

export JAVA_HOME=/opt/local/java/jdk

export SCALA_HOME=/opt/local/scala

export SPARK_WORKER_MEMORY=1g

export SPARK_MASTER_IP=192.168.31.62

export SPARK_DRIVER_MEORY=1G

export SPARK_LOCAL_DIRS=/opt/local/spark

export HADOOP_CONF_DIR=/opt/local/hadoop/etc/hadoop

export HADOOP_HOME=/opt/local/hadoop

slaves

slave1

slave2

http://hadoop.apache.org/docs/r2.7.1/hadoop-project-dist/hadoop-common/ClusterSetup.html

spark on yarn 集群部署的更多相关文章

Spark on Yarn 集群运行要点
实验版本:spark-1.6.0-bin-hadoop2.6 本次实验主要是想在已有的Hadoop集群上使用Spark,无需过多配置 1.下载&解压到一台使用spark的机器上即可 2.修改配 ...
Spark概述及集群部署
Spark概述什么是Spark (官网:http://spark.apache.org) Spark是一种快速.通用.可扩展的大数据分析引擎,2009年诞生于加州大学伯克利分校AMPLab,2010 ...
Spark on Yarn集群搭建
软件环境: linux系统: CentOS6.7 Hadoop版本: 2.6.5 zookeeper版本: 3.4.8 主机配置: 一共m1, m2, m3这五部机, 每部主机的用户名都为centos ...
Ha-Federation-hdfs +Yarn集群部署方式
经过一下午的尝试,终于把这个集群的搭建好了,搭完感觉也没有太大的必要,就当是学习了吧,为之后搭建真实环境做基础. 以下搭建的是一个Ha-Federation-hdfs+Yarn的集群部署. 首先讲一下 ...
大数据【三】YARN集群部署
一概述 YARN是一个资源管理.任务调度的框架,采用master/slave架构,主要包含三大模块:ResourceManager(RM).NodeManager(NM).ApplicationMa ...
hadoop - spark on yarn 集群搭建
一.环境准备 1. 机器: 3 台虚拟机机器角色 l-qta3.sp.beta.cn0 NameNode,ResourceManager,spark的master l-querydiff1.sp ...
配置Spark on YARN集群内存
参考原文:http://blog.javachen.com/2015/06/09/memory-in-spark-on-yarn.html?utm_source=tuicool 运行文件有几个G大,默 ...
（转）yarn 集群部署，遇到的问题小结
link:http://blog.csdn.net/uniquechao/article/details/26449761 版本信息: hadoop 2.3.0 hive 0.11.0 1. ...
yarn 集群部署，遇到的问题小结
版本号信息: hadoop 2.3.0 hive 0.11.0 1. Application Master 无法訪问点击application mater 链接,出现 http 500 错 ...

随机推荐

【转载】C#检测客户端输入的内容是否含有危险字符串
用户在客户端提交的内容有时候并不可信,如果客户端提交的内容中含有危险字符串信息,则很有可能造成应用程序安全性问题,如SQL注入风险等.因此在接收客户端提交过来的数据后,我们首先需要判断数据中是否含有危 ...
Host '127.0.0.1' is not allowed to connect to this MySQL server
错误:Host '127.0.0.1' is not allowed to connect to this MySQL server 一般原因: MySQL数据库的配置文件my.i ...
MyEclipse中jsp编码设置
window->preference->Myeclipse->files and editors->jsp,设置编码为utf-8 2.window->preference ...
【Java每日一题】20170228
20170227问题解析请点击今日问题下方的“[Java每日一题]20170228”查看(问题解析在公众号首发,公众号ID:weknow619) package Feb2017; import jav ...
Netty 系列五（单元测试）.
一.概述和原理 Netty 的单元测试,主要是对业务逻辑的 ChannelHandler 做测试(毕竟对 Bootstrap.EventLoop 这些做测试着实没有多大意义),模拟一次入站数据或者出站 ...
Java集合框架学习
集合框架集合框架的目标该框架必须是高性能的.基本集合(动态数组,链表,树,哈希表)的实现必须是高效的. 该框架允许不同类型的集合,以类似的方式工作,具有高度的互操作性. 对一个集合的扩展和适应必 ...
git 常用操作，下拉，提交，更新，还原
注: origin为远程仓库名称 master为远程分支名称 //第一次提交所有代码 1.git clone 项目url 2.复制.git 和文件到根目录 3.git add . 4.git co ...
Dynamics 365 Online-试用环境申请地址
https://trials.dynamics.com/Dynamics365/Signup/sales 需要用企业邮箱
arcgis在折点处打断并建立网络分析(最短路径等问题)
目的:GIS网络分析用于对段路径等问题.这里仅仅讲述如何建立网络分析. 网络建立前必须满足以下条件 1.要素文件在节点处打断(本文下面会叙述) 2.要素文件在地理数据库里的数据集里(一般是这样) 3. ...
开发Spring过程中几个常见异常（一）
异常一:java.lang.NoClassDefFoundError: org/apache/commons/logging/LogFactory 原因:未导入有关日志管理的jar包或者未添加到路径. ...

spark on yarn 集群部署

spark on yarn 集群部署的更多相关文章

随机推荐

热门专题