最新版spark1.1.0集群安装配置

和分布式文件系统和NoSQL数据库相比而言，spark集群的安装配置还算是比较简单的：

很多教程提到要安装java和scala，但我发现spark最新版本是包含scala的，JRE采用linux内嵌的版本也是可以的！

在主节点（bluejoe0）上安装spark1.1.0：

wget http://mirror.bit.edu.cn/apache/spark/spark-1.1.0/spark-1.1.0-bin-hadoop2.3.tgz

tar -zxvf spark-1.1.0-bin-hadoop2.3.tgz

ln -s spark-1.1.0-bin-hadoop2.3 spark
启动spark-shell：

cd /usr/local/spark/bin

./spark-shell

可以看到spark已经自带了scala 2.10：
输入测试程序：

scala> val data = Array(1, 2, 3, 4, 5)

data: Array[Int] = Array(1, 2, 3, 4, 5)

scala> val distData = sc.parallelize(data)

distData: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[0] at parallelize at <console>:14

scala> distData.reduce(_+_)
可以观察4040端口：
也可以测试PI的计算：

./bin/run-example SparkPi

14/11/23 16:08:25 INFO SparkContext: Job finished: reduce at SparkPi.scala:35, took 1.008332384 s

Pi is roughly 3.1403
也可以采用spark-submit来提交任务：

./bin/spark-submit --class org.apache.spark.examples.SparkPi --master local[6] /usr/local/spark/lib/spark-examples-1.1.0-hadoop2.3.0.jar 1000

14/11/23 16:07:30 INFO SparkContext: Job finished: reduce at SparkPi.scala:35, took 46.220537186 s

Pi is roughly 3.14172056
现在安装几个从节点，scp spark.tgz文件到其它节点，如：bluejoe4,bluejoe5,bluejoe9
注意设置好ssh无密码登录；
修改conf/slaves

# A Spark Worker will be started on each of the machines listed below.

bluejoe4

bluejoe5

bluejoe9
在bluejoe0上启动spark集群：

./sbin/start-all.sh

此时可以在浏览器上观察到3个从节点的情况：
再测试在集群上计算PI的程序：

./bin/spark-submit --class org.apache.spark.examples.SparkPi --master spark://bluejoe0:7077 /usr/local/spark/lib/spark-examples-1.1.0-hadoop2.3.0.jar 1000

14/11/23 16:05:00 INFO SparkContext: Job finished: reduce at SparkPi.scala:35, took 26.322514766 s

Pi is roughly 3.14159516

此时观察浏览器的显示：

随机推荐

wxWidgets Tutorial
wxWidgets Tutorial网站整理两个重要的教程网站:1:点这里:2:点这里. 还有一个wxWidgets项目参考的网站:点这里. 已经翻译好的中文教程:点这里. 参考书籍:<wxW ...
自编译安装nginx
1. 下载nginx,并解压 http://nginx.org/ 2. 下载health check模块 p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 1 ...
HW6.15
import java.util.Scanner; import java.util.ArrayList; public class Solution { public static void mai ...
异常（Exception）
1.Java中所有的异常类都会直接或间接地继承自Exception. 2.RuntimeException类也是直接继承自Exception类,它叫做运行时异常,Java中所有的运行时异常都会直接或间 ...
Android实例-LocationSensor位置传感器(XE8+小米2)
结果: 1.启动后有时会闪退,后来重新做的工程就好了.原因不明(可能与地理反码有关). 2.原文是用的GOOGLE地图显示位置,但在咱们这里好像不行,改为百度,但百度用的是HTML文件.太麻烦了,大家 ...
void类型及void指针
1.概述许多初学者对C/C 语言中的void及void指针类型不甚理解,因此在使用上出现了一些错误.本文将对void关键字的深刻含义进行解说,并详述void及void指针类型的使用方法与技巧. 2 ...
opencv 通过摄像头捕捉头部
code: #include <opencv\cv.h> #include <opencv\highgui.h> #include <opencv\cxcore.h> ...
Android Studio 编译不通过，报错“找不到org.apache.http
如果你使用的 target sdk是23请在build.gradle加入 android{ useLibrary ‘org.apache.http.legacy‘ }
jQuery生成二维条形码 jquery.qrcode.js
国内私募机构九鼎控股打造APP,来就送 20元现金领取地址:http://jdb.jiudingcapital.com/phone.html内部邀请码:C8E245J (不写邀请码,没有现金送)国内私 ...
linux下web压力测试工具ab使用及详解
APACHE自带的测试工具AB(apache benchmark).在APACHE的bin目录下.格式: ./ab [options] [http://]hostname[:port]/path参数: ...

最新版spark1.1.0集群安装配置

最新版spark1.1.0集群安装配置的更多相关文章

随机推荐

热门专题