1.下载源码,根据自己的环境编译,我这里下载的是spark1.3版本 本人采用sbt编译, SPARK_HADOOP_VERSION=2.5.2 SPARK_YARN=ture sbt/sbt assembly 这句代码共有两个参数,第一个是指本机的hadoop环境的版本,第二个参数是指是否在yarn上运行, 2.编译完成后会生成make-distribution.sh文件3.然后我们需要将生成的部署包部署在集群上 这里有几个参数说明一下: --hadoop VERSION :hadoop版本号…