spark1.6.0伪分布式搭建

环境：

　　hadoop2.6.0

　　jdk1.8

　　ubuntu 14.04 64位

1 安装scala环境

版本是scala-2.10.6，官网下载地址http://www.scala-lang.org/download/

然后配置scala的环境变量：sudo vim /etc/profile

export SCALA_HOME=/usr/scala/scala-2.10.
export PATH=$PATH:$SCALA_HOME/bin

执行命令source /etc/profile 让环境变量生效

scala检测：在任意目录执行scala -version，结果如下：

2 spark配置

首先下载spark的压缩包，官网下载地址http://spark.apache.org/downloads.html

按照上图所示选取，然后下载spark-1.6.0-bin-hadoop2.6.tgz压缩包

解压到安装目录下，比如我是解压到/usr/local目录下，并且重命名为spark

进入spark/conf目录，把 spark-env.sh.template文件复制并且重命名为 spark-env.sh，并且在文件末尾加上如下配置

export JAVA_HOME=/usr/java/jdk1.8.0_141
export SCALA_HOME=/usr/scala/scala-2.10.6
export SPARK_MASTER_IP=master
export SPARK_WORKER_CORES=2
export SPARK_WORKER_MEMORY=1g
export HADOOP_CONF_DIR=/usr/local/hadoop/etc/hadoop

其中export SPARK_MASTER_IP是指master的ip，由于我是伪分布式搭建，ip就是本机，而我在hosts中配置过本机ip为master

然后把 slaves.template文件复制重命名为slaves，文件的默认内容是localhost，把localhost删除，并添加内容master

（如果是完全分布式，就要把每个salve中的spark-env.sh文件中的SPARK_MASTER_IP参数改成master的ip，把master和每个slave上的slaves文件内容写成每一行一个slave的ip地址）

以上就完成了，然后进行再打开hadoop的dfs和yarn的服务后，再spark的目录下，执行sbin/start-all.sh,就启动spark进程了，然后执行jps查看，如下图，多了Master和Worker两个进程，就说明ok了。

spark1.6.0伪分布式搭建的更多相关文章

bayaim_hadoop1_2.2.0伪分布式搭建
------------------bayaim_hadoop1_2.2.0伪分布式搭建_2018年11月06日09:21:46--------------------------------- 1. ...
hadoop2.4.0伪分布式搭建以及分布式关机重启后datanode没起来的解决办法
1.准备Linux环境 1.0点击VMware快捷方式,右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改subnet ip ...
hadoop2.2.0伪分布式搭建3--安装Hadoop
3.1上传hadoop安装包 3.2解压hadoop安装包 mkdir /cloud #解压到/cloud/目录下 tar -zxvf hadoop-2.2.0.tar.gz -C /cloud/ 3 ...
hadoop2.2.0伪分布式搭建1--准备Linux环境
1.0修改网关点击VMware快捷方式,右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改subnet ip 设置网段:19 ...
hadoop2.2.0伪分布式搭建
1.准备Linux环境 1.0点击VMware快捷方式,右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改subnet ...
Hadoop2.6.0伪分布式搭建
环境: 1.Ubuntu14.04 首先要在linux系统上新建一个账户,比如就叫做hadoop,用于专门运行hadoop. 2.配置jdk 我是使用的版本是jdk1.8. 解压:创建/usr/jav ...
hadoop2.2.0伪分布式搭建2--安装JDK
2.1上传FileZilla 上传 https://filezilla-project.org/ 2.2解压jdk #创建文件夹 mkdir /usr/java #解压 tar -zxvf jdk-7 ...
[b0006] Spark 2.0.1 伪分布式搭建练手
环境: 已经安装好: hadoop 2.6.4 yarn 参考: [b0001] 伪分布式 hadoop 2.6.4 准备: spark-2.0.1-bin-hadoop2.6.tgz 下载地址: ...
Spark2.4.0伪分布式环境搭建
一.搭建环境的前提条件环境:ubuntu-16.04 hadoop-2.6.0 jdk1.8.0_161. spark-2.4.0-bin-hadoop2.6.这里的环境不一定需要和我一样,基本版 ...

随机推荐

django-初始配置(纯手写)
我们通过django-admin startproject zhuyu命令创建好项目后,在pycharm中打开我们需要在在该项目中,配置一些相关操作. 1.template(存放模板的文件夹) 如果 ...
【原创】关于skip-gram的个人理解
★skip-gram的关键术语与详细解释: [语料]—— 所有句子文档(当然会出现大量重复的单词) [词典(可用V维的onehot编码来表示)]—— 语料中出现的所有单词的集合(去除了重复词) [ ...
jQuery Ajax请求后台数据并在前台接收
1.ajax基本语法 <script> $(function(){ $('#sub').click(function(){ var username=$('#username').val( ...
python元组操作
元组:(tuple)元素不可被修改,不能被增加或者删除一般写元组的时候,建议在最后加上一个逗号可以索引取值可以切片取值元组一级元素不可被修改,但是二级及以后可以被修改 count() 获 ...
web pack
WebPack是模块捆绑器,如果你的代码跨越了不同模块(例如不同Javascript文件),web pack可以将这些零散的代码构建到浏览器可读单个文件中. web pack还可以作为构建通道,你可以 ...
jQuery(四)--HTTP请求
<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title> ...
中间件kafka
* kafka----一个发布订阅消息系统,中间件:一个分布式.分区.可重复的日志服务kafka需要了解基础几层结构,生产者订阅者等使用方法,和在高并发.一致性场景使用.(凡事面试问一致性.高并发都脱 ...
Java学习笔记三:Java的变量、常量、变量的类型及使用规则
Java的变量.常量.变量的类型及使用规则每一种语言都有一些具有特殊用途的词,Java也不例外,它们被称为关键字.关键字对 Java 的编译器有着特殊的意义. 一:Java中的关键字: 注:Java ...
PHP.41-TP框架商城应用实例-后台16-商品属性2-AJAX添加、删除
添加商品属性思路:根据[后台15]类型表{id,type_name}与属性表{id,attr_name,attr_type,attr_option_values,type_id} 1.建表商品属性 ...
【Consul】Consul架构-Session会话
Consul提供session会话机制--可以用于构建分布式锁,session可以绑定到节点.健康检查.KV数据.目的是提供颗粒锁--受 The Chubby LockService for Loos ...

spark1.6.0伪分布式搭建

spark1.6.0伪分布式搭建的更多相关文章

随机推荐

热门专题