分布式配置 Spark 2.0版本 2.1版本 1.6版本

apache的各个软件各个版本下载： http://archive.apache.org/dist/

1.下载spark.

　　sudo tar -zxf ~/下载/spark-2.0.2-bin-without-hadoop.tgz -C /usr/local/

　　cd /usr/local

　　sudo mv ./spark-2.0.2-bin-without-hadoop/ ./spark

　　sudo chown -R ubuntu ./spark

2.在Mster节点主机的终端中执行如下命令：

　　vim ~/.bashrc

　　在.bashrc添加如下配置：

　　　　export SPARK_HOME=/usr/local/spark
　　　　export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin
　　执行如下命令使得配置立即生效：

　　　　source ~/.bashrc

3.在Master节点主机上进行如下操作：

　　配置slaves文件
　　　　将 slaves.template 拷贝到 slaves

1. cd /usr/local/spark/
2. cp ./conf/slaves.template ./conf/slaves

　　　　slaves文件设置Worker节点。编辑slaves内容,把默认内容localhost替换成如下内容：

　　　　slave01　　　　

　　配置spark-env.sh文件

　　　　将 spark-env.sh.template 拷贝到 spark-env.sh

　　　　　　cp ./conf/spark-env.sh.template ./conf/spark-env.sh

　　编辑spark-env.sh,添加如下内容：

　　　　export SPARK_DIST_CLASSPATH=$(/usr/local/hadoop/bin/hadoop classpath) 　　　　

　　　　export HADOOP_CONF_DIR=/usr/local/hadoop/etc/hadoop 　　　　

　　　　export SPARK_MASTER_IP=192.168.1.104

　　　　　　SPARK_MASTER_IP 指定 Spark 集群 Master 节点的 IP 地址；

　　配置好后，将Master主机上的/usr/local/spark文件夹复制到各个节点上。在Master主机上执行如下命令：

1. cd /usr/local/
2. tar -zcf ~/spark.master.tar.gz ./spark
3. cd ~
4. scp ./spark.master.tar.gz slave01:/home/hadoop
5. scp ./spark.master.tar.gz slave02:/home/hadoop

　　在slave01,slave02节点上分别执行下面同样的操作：

1. sudo rm -rf /usr/local/spark/
2. sudo tar -zxf ~/spark.master.tar.gz -C /usr/local
3. sudo chown -R hadoop /usr/local/spark

4.启动hadoop集群，在master节点上运行。

cd /usr/local/hadoop/
sbin/start-all.sh

5.启动spark集群，在master节点上运行。

　　cd /usr/local/spark/

　　sbin/start-master.sh

　　在Master节点上运行jps命令，可以看到多了个Master进程：

　　　　15093 Jps

　　　　14343 SecondaryNameNode

　　　　14121 NameNode

　　　　14891 Master　

　　　　14509 ResourceManager

　　启动所有Slave节点，在Master节点主机上运行如下命令：

　　　　sbin/start-slaves.sh

　　分别在slave01、slave02节点上运行jps命令，可以看到多了个Worker进程

　　　　37553 DataNode

　　　　37684 NodeManager

　　　　37876 Worker

　　　　37924 Jps

　　http://172.19.57.221:8080/ spark web网页。

6.关闭spark集群

　　关闭Master节点

　　　　sbin/stop-master.sh

　　关闭Worker节点

　　　　sbin/stop-slaves.sh

关闭Hadoop集群

cd /usr/local/hadoop/

sbin/stop-all.sh

分布式配置 Spark 2.0版本 2.1版本 1.6版本的更多相关文章

转载：Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04
原文 http://www.powerxing.com/install-hadoop/ 当开始着手实践 Hadoop 时,安装 Hadoop 往往会成为新手的一道门槛.尽管安装其实很简单,书上有写到, ...
Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04
摘自: http://www.cnblogs.com/kinglau/p/3796164.html http://www.powerxing.com/install-hadoop/ 当开始着手实践 H ...
Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04（转）
http://www.powerxing.com/install-hadoop/ http://blog.csdn.net/beginner_lee/article/details/6429146 h ...
【转】Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04
原文链接:http://dblab.xmu.edu.cn/blog/install-hadoop/ 当开始着手实践 Hadoop 时,安装 Hadoop 往往会成为新手的一道门槛.尽管安装其实很简单, ...
分布式配置hadoop2.5.0 2.6.x
1. sudo vim /etc/hostname 在master的机器上,改成 master 在slave上写 slave01,02,03...... 配置好后重启. 2. sudo vi ...
Ubuntu14.04 安装配置Hadoop2.6.0
目前关于Hadoop的安装配置教程书上.官方教程.博客都有很多,但由于对Linux环境的不熟悉以及各种教程或多或少有这样那样的坑,很容易导致折腾许久都安装不成功(本人就是受害人之一).经过几天不断尝试 ...
Apache Spark 3.0 预览版正式发布，多项重大功能发布
2019年11月08日数砖的 Xingbo Jiang 大佬给社区发了一封邮件,宣布 Apache Spark 3.0 预览版正式发布,这个版本主要是为了对即将发布的 Apache Spark 3. ...
CentOS 7.0下面安装并配置Spark
安装环境: 虚拟机:VMware® Workstation 8.0.1(网络桥接) OS:CentOS 7 JDK版本:jdk-7u79-linux-x64.tar Scala版本:scala-2.1 ...
在eclipse中配置spark 0.9.1源码的开发环境
一.准备工作: 1.下载release版spark 0.9.1,本次用的版本是spark-0.9.1-bin-cdh4. 2.下载scala IDE 3.0.2,这个版本ide的支持scala 2.1 ...

随机推荐

T-SQL GROUP BY子句分组查询
SQL Server GROUP BY子句与SELECT语句协作使用,以将相同的数据分组. GROUP BY子句位于SELECT语句中的WHERE子句之后,位于ORDER BY子句之前. 语法以下是 ...
mybatis：自动分页插件
项目地址:https://github.com/pagehelper/pagehelper-spring-boot 简单使用: 1.在pom文件中添加 <dependency> <g ...
oracle加密传输
参考文章: http://blog.itpub.net/24052272/viewspace-2129175/ oracle在传输过程中,正常是明文传输的,例如SQL以及执行的结果. 看看做的测试: ...
正版phpstorm，webstorm，goland（Jetbrains系列都可以）免费激活步骤（图文详解）(亲测有效)
1 前言 Jetbrains系列都可以,包括webstrom,phpstorm,goland等. 附加其它方案如下: webstrom(注册机) goland(破解补丁) 2 步骤 1. 可以先试用, ...
Django 笔记（五）自定义标签 ~ 映射mysql
创建简单标签: 1-3 或者 2-3 创建包含标签: 1-2或1-3或1-4(推荐) 包含标签使用: 2 和 4对应上面的使用方法在虚拟环境中安装: pip install pymysql 在set ...
DataGridView中进行增删改查
首先我们需要知道是在哪个数据库中的哪个表进行增删改查: 这就需要我们: 建立给连接服务器的类:(可以在方法类中建立) 建立一个对列名进行封装的类:方便数据之间的传接:(学到Linq-sql时这些就简便 ...
JavaScript从入门到精通（附光盘1张）:作者:明日科技出版社:清华大学出版社出版时间:2012年09月
本书介绍一:本书 pdf 获取信息本书下载:请申请加入本群 (QQ群:668345923), 并联系群主. 本群主有:本书pdf 全文教材及附带的光盘内容二:本书目录介绍第1篇基 ...
Confluence 6 警告的类型
有下面的一些类型的警告. 警告和知识库(Alert and KB) 级别(Level) 默认阈值(Default threshold) 可配置(Configurable) Low free disk ...
【Java】SpringBoot配置文件读取中文乱码
[问题]在配置文件application.properties中配置一个值含有中文的变量.spring加载配置之后,读取的变量中文部分出现乱码.根据CSDN说的一堆办法,改encoding为UTF-8 ...
sublime c++
install: sudo add-apt-repository ppa:webupd8team/sublime-text-3 sudo apt-get update sudo apt-get i ...

分布式配置 Spark 2.0版本 2.1版本 1.6版本

分布式配置 Spark 2.0版本 2.1版本 1.6版本的更多相关文章

随机推荐

热门专题