002 Spark的编译

一：不编译

1.不编译的做法

　　在公司里可能需要编译，但是如果为了简单的学习就不必编译，直接在官方下载即可。

　　截图为：

二：编译\

1.下载

　　http://archive.cloudera.com/cdh5/cdh/5/

　　http://archive.apache.org/dist/

2.环境要求

3.官方要求位置

4.检测环境

5.解压resposity（需要的包）

6.解压spark

　　 tar -xvf spark-1.6.1.taz -C /etc/opt/modules/

7.修改make-distribution.sh文件

　　我想，应该是替换掉上面的变量

8.修改pom.xml（共两处scala.version）

9.放置依赖服务，先上传

　　如果不给，则需要在网上自己下载，时间太久。

10.将依赖的压缩包解压到spark下的build下

　　tar -zxvf zinc-0.3.5.3.tgz -C /etc/opt/modules/spark-1.6.1/build

　　tar -zxvf scala-2.10.4.tgz -C /etc/opt/modules/spark-1.6.1/build

11.CDH编译以及apache编译（选择一种）

　　在这里使用apache编译

　　./make-distribution.sh --tgz \

　　-Phadoop-2.4 \
　　-Dhadoop.version=2.5.0 \
　　-Pyarn \
　　-Phive -Phive-thriftserver

　　解释：

　　tgz：打包压缩

　　-P：环境变量

12.编译的结果

13.编译好的jar包

三：结束

1.到此为止，打包压缩已经完成，就意味着编译已经成功。

002 Spark的编译的更多相关文章

Spark的编译
由于Spark的运行环境的多样性,如可以运行在hadoop的yarn上,这样就必须要对Spark的源码进行编译.下面介绍一下Spark源码编译的详细步骤: 1.Spark的编译方式:编译的方式可以参考 ...
Spark程序编译报错error: object apache is not a member of package org
Spark程序编译报错: [INFO] Compiling 2 source files to E:\Develop\IDEAWorkspace\spark\target\classes at 156 ...
Spark Tachyon编译部署（含单机和集群模式安装）
Tachyon编译部署编译Tachyon 单机部署Tachyon 集群模式部署Tachyon 1.Tachyon编译部署 Tachyon目前的最新发布版为0.7.1,其官方网址为http://tac ...
Spark wordcount 编译错误 -- reduceByKey is not a member of RDD
Attempting to run http://spark.apache.org/docs/latest/quick-start.html#a-standalone-app-in-scala fro ...
windows下 eclipse搭建spark java编译环境
环境: win10 jdk1.8 之前有在虚拟机或者集群上安装spark安装包的,解压到你想要放spark的本地目录下,比如我的目录就是D:\Hadoop\spark-1.6.0-bin-hadoop ...
spark cdh5编译安装[spark-1.0.2 hadoop2.3.0 cdh5.1.0]
前提你得安装有Hadoop 我的版本hadoop2.3-cdh5.1.0 1.下载maven包 2.配置M2_HOME环境变量,配置maven 的bin目录到path路径 3.export MAVEN ...
spark 预编译安装
1.下载地址: http://mirrors.tuna.tsinghua.edu.cn/apache/spark/spark-3.0.0-preview/spark-3.0.0-preview-bin ...
Spark入门实战系列--2.Spark编译与部署（上）--基础环境搭建
[注] 1.该系列文章以及使用到安装包/测试数据可以在<倾情大奉送--Spark入门实战系列>获取: 2.Spark编译与部署将以CentOS 64位操作系统为基础,主要是考虑到实际应用 ...
Spark编译与部署
Spark入门实战系列--2.Spark编译与部署(上)--基础环境搭建 [注] 1.该系列文章以及使用到安装包/测试数据可以在<倾情大奉送--Spark入门实战系列>获取: 2.S ...

随机推荐

Java SE之For增强与Iterator遍历器提取数据(附Map.Entry)
增强for循环: 1.操作数组 2.操作List集合 3.操作Map集合 1.map.values()法 2.map.keySet()法 [传统方法] 3.Map.Entry法 ...
python线程，pipe管道通信原理
Pipe管道: * 管道实例化后会产生两个通道,分别交给两个进程* 通过send和recv来交互数据,这是一个双向的管道,child和parent可以互相收发 from multiprocessing ...
8、判断三角形ABC中是否有点D
思路: 首先连接AD,BD,CD,SABC为三角形的面积,SABD为三角形ABD的面积,SACD....,SBCD....... 因此,若D在三角形则SABC = SABD + SACD + SBCD ...
saltstack系列~第二篇
一简介:今天咱们来继续学习saltstack 二命名和分组 1 命名规则 1 ID构成机房-DB类型-角色(主/从)-IP地址 2 分组构成分为master slave两组即可 2 分组规则 ...
ubuntu14.04 提示卷文件系统根目录仅剩余xxx的硬盘空间
Difference between plt.draw() and plt.show() in matplotlib
Difference between plt.draw() and plt.show() in matplotlib down voteaccepted plt.show() will display ...
volatile的深入理解--【sky原创】
volatile 所有定义的变量都是在内存上面的, 例如: int i = 10; int j = i; int k = i; i = 10; 是初始化的变量,存放在数据段,未初始化的变量存放在 ...
通达OA2008优化前端web为lnmp环境及后续优化
1.安装lnmp环境具体参考:CentOS6.5编译安装Nginx1.8.1+MySQL5.5.48+PHP5.2.17+xcache3.2+ZendOptimizer-3.3.9 http://b ...
Eureka 开发时快速剔除失效服务
Spring Cloud 版本: Dalston.SR5 服务端配置: # 关闭保护机制 eureka.server.enable-self-preservation=false #剔除失效服务间隔 ...
Ubungu 18.04安装MySQL 5.7.24
Ubuntu 18.04,mysql Ver 14.14 Distrib 5.7.24, for Linux (x86_64), USERNAME@USERNAME-VirtualBox:~$ sud ...

002 Spark的编译

002 Spark的编译的更多相关文章

随机推荐

热门专题