由于越来越多的人开始使用spark计算框架了,而且spark计算框架也是可以运行在yarn的平台上,因此可以利用单个集群,运行多个计算框架.这是一些大公司都是这么干的.好了,下面讲一下spark1.3.1是如何安装到集群上去的. 1.由于spark的计算框架依赖于scala,因此在安装spark之前,必须安装scala,于是通过网上下载scala-2.10.5.tgz软件包 (1)解压 tar -zxvf scala-2.10.5.tgz (2)配置环境变量 SCALA_HOME=/home/g…