Spark 集群搭建

0. 说明

　　Spark 集群搭建

　　【集群规划】

服务器主机名	ip	节点配置
s101	192.168.23.101	Master
s102	192.168.23.102	Worker
s103	192.168.23.103	Worker
s104	192.168.23.104	Worker

1. Spark 集群搭建

　　1.0 前提

　　完成 Spark 单节点的安装，参照 Spark 基本概念 & 安装安装部分

　　基于 Hadoop 完全分布式集群

　　1.1 配置 JAVA_HOME 环境变量

# 复制 spark-env.sh
cd /soft/spark/conf
cp spark-env.sh.template spark-env.sh

# 配置 JAVA_HOME 环境变量

nano spark-env.sh

export JAVA_HOME=/soft/jdk

　　1.2 在 Spark 的 conf 目录下创建 Hadoop 的 core-site.xml 和 hdfs-site.xml 符号连接

ln -s /soft/hadoop/etc/hadoop/core-site.xml /soft/spark/conf/core-site.xml

ln -s /soft/hadoop/etc/hadoop/hdfs-site.xml /soft/spark/conf/hdfs-site.xml

　　1.3 修改 slaves 文件

# 复制 slaves
cd /soft/spark/conf
cp slaves.template slaves

# 修改 slaves 文件

nano  slaves

s102

s103

s104

　　1.4 分发 Spark

# 分发 Spark 符号链接

xsync.sh /soft/spark

# 分发 Spark 安装目录

xsync.sh /soft/spark-2.1.-bin-hadoop2.

　　1.5 分发环境变量

# 切换 root 用户
su root

# 分发环境变量配置文件

xsync.sh /etc/profile

# 退出 root 用户

exit

　　1.6 生效环境变量

# 分别在s102-s104生效环境变量

source /etc/profile

2. 启动 Spark 集群

　　2.1 启动 ZooKeeper

# 在 s101 执行

xzk.sh start

　　2.2 启动 HDFS

start-dfs.sh

　　2.3 启动 Spark

# 进入目录

cd /soft/spark/sbin

# 启动

./start-all.sh

　　2.4 进入 Spark 的 Web UI
　　http://s101:8080

　　2.5 上传文件到 HDFS 中

　　文件内容为以空格分隔的文本。

hdfs dfs -put wc1.txt /

　　2.6 启动 spark shell，连接到 Spark 集群

# 启动 spark shell，连接到 Spark 集群

spark-shell --master spark://s101:7077

# 测试

sc.textFile("/wc1.txt").flatMap(_.split(" ")).map((_,)).reduceByKey(_+_).collect()

3. 配置 s105 作为 Client [可选]

　　【说明】

　　配置 s105 作为 Cluster 模式提交 Spark job

　　【过程】

　　参照以上步骤完成，在有需要的时候配置

Spark 集群搭建的更多相关文章

（四）Spark集群搭建-Java&Python版Spark
Spark集群搭建视频教程 1.优酷 2.YouTube 安装scala环境下载地址http://www.scala-lang.org/download/ 上传scala-2.10.5.tgz到m ...
Spark集群搭建简要
Spark集群搭建 1 Spark编译 1.1 下载源代码 git clone git://github.com/apache/spark.git -b branch-1.6 1.2 修改pom文件 ...
Spark集群搭建简配+它到底有多快？【单挑纯C/CPP/HADOOP】
最近耳闻Spark风生水起,这两天利用休息时间研究了一下,果然还是给人不少惊喜.可惜,笔者不善JAVA,只有PYTHON和SCALA接口.花了不少时间从零开始认识PYTHON和SCALA,不少时间答了 ...
Spark集群搭建中的问题
参照<Spark实战高手之路>学习的,书籍电子版在51CTO网站资料链接 Hadoop下载[链接](http://archive.apache.org/dist/hadoop/core/ ...
Spark集群搭建_Standalone
2017年3月1日, 星期三 Spark集群搭建_Standalone Driver: node1 Worker: node2 Worker: node3 1.下载安装下载地址 ...
Spark集群搭建_YARN
2017年3月1日, 星期三 Spark集群搭建_YARN 前提:参考Spark集群搭建_Standalone 1.修改spark中conf中的spark-env.sh 2.Spark on ...
spark集群搭建
文中的所有操作都是在之前的文章scala的安装及使用文章基础上建立的,重复操作已经简写: 配置中使用了master01.slave01.slave02.slave03: 一.虚拟机中操作(启动网卡)s ...
hadoop+spark集群搭建入门
忽略元数据末尾回到原数据开始处 Hadoop+spark集群搭建说明: 本文档主要讲述hadoop+spark的集群搭建,linux环境是centos,本文档集群搭建使用两个节点作为集群环境:一个 ...
Spark集群搭建（local、standalone、yarn）
Spark集群搭建 local本地模式下载安装包解压即可使用,测试(2.2版本)./bin/spark-submit --class org.apache.spark.examples.SparkP ...

随机推荐

Ansible-安装-秘钥-部署-使用
本文转自:https://www.cnblogs.com/ylqh/p/5902259.html ansiblemaster:192.168.74.146 ansibleslave1 :192.168 ...
study design of ADNI
AD(Alzheimers disease):不可逆的神经退化,患病人员会由于脑部问题的恶化而导致心智功能不健全. ADNI:阿尔茨海默氏症神经成像项目 ADNI的总体目标是验证用于阿尔茨海默病临床 ...
RocketMQ专题2：三种常用生产消费方式(顺序、广播、定时)以及顺序消费源码探究
顺序.广播.定时任务前插在进行常用的三种消息类型例子展示的时候,我们先来说一说RocketMQ的几个重要概念: PullConsumer与PushConsumer:主要区别在于Pull与Pus ...
Quart2D文字图像绘制
上一个是绘制简单图形,这一篇学习绘制文字.图像 //获取画布 CGContextRef context=UIGraphicsGetCurrentContext(); //设置边框颜色 CGContex ...
RadioButtonList根据值触发OnSelectedIndexChanged事件
Insus.NET有使用Iframe来处理另外一个站点的enter form,由于需要自动循环填入数据,免去人手操作.但是原来的Enter from有RadioButtonList控件以及OnSele ...
AngularJS学习笔记（五）自定义指令（1）
先来说说自定义指令 ng通过内置指令的方式实现了对html的增强,同时也赋予了我们自定义指令的功能,让我们根据实际需求进行指令的定制.自定义指令涉及到模板(template).作用域(scope).数 ...
Js的substring和C#的Substring
Js的substring 语法: 程序代码String.substring(start, end) 说明:返回一个从start开始到end(不包含end)的子字符串. 示例: 程序代码var str= ...
EF数据库优先模式（三）
今天2018年4月1日,呼叫王伟,81192,收到请返航! 接上次说,本节将LINQ以及lambda表达式 LINQ是C#里面针对SQL Server特有的数据访问操作方法,通俗一点说就是类似于写SQ ...
vue-infinite-loading2.0 中文文档
简介这是一个使用在Vue.js中的无限滚动插件,它可以帮助你快速创建一个无限滚动列表. 特点移动端支持友好兼容任何一个可以滚动的元素有不同的旋转器可以作为加载动画支持加载后显示结果支持两个 ...
Codeforces633G(SummerTrainingDay06-I dfs序+线段树+bitset)
G. Yash And Trees time limit per test:4 seconds memory limit per test:512 megabytes input:standard i ...

Spark 集群搭建

0. 说明

1. Spark 集群搭建

2. 启动 Spark 集群

3. 配置 s105 作为 Client [可选]

Spark 集群搭建的更多相关文章

随机推荐

热门专题