spark安装配置

一、下载解压

二、配置

（假设已经配置了Java、Hadoop）

1、环境变量

2、spark配置

进入spark安装目录，复制文件

编辑spark-env.sh文件，在文件中添加如下信息（括号中路径为Hadoop的路径），有了下面的配置信息以后，Spark就可以把数据存储到Hadoop分布式文件系统HDFS中，也可以从HDFS中读取数据。如果没有配置上面信息，Spark就只能读写本地数据，无法读写HDFS数据。

3、运行自带案例

接下来会出现版一大堆信息

4、启动spark（没有启动Hadoop）

spark-shell命令及其常用的参数如下：

spark-shell --master <master-url>

Spark的运行模式取决于传递给SparkContext的Master URL的值。Master URL可以是以下任一种形式：
（1） local 使用一个Worker线程本地化运行SPARK(完全不并行)
（2） local[*] 使用逻辑CPU个数数量的线程来本地化运行Spark
（3） local[K] 使用K个Worker线程本地化运行Spark（理想情况下，K应该根据运行机器的CPU核数设定）
（4） spark://HOST:PORT 连接到指定的Spark standalone master。默认端口是7077.
（5）yarn-client 以客户端模式连接YARN集群。集群的位置可以在HADOOP_CONF_DIR 环境变量中找到。
（6） yarn-cluster 以集群模式连接YARN集群。集群的位置可以在HADOOP_CONF_DIR 环境变量中找到。
（7） mesos://HOST:PORT 连接到指定的Mesos集群。默认接口是5050。

获取帮助信息

spark-shell --help

在Spark中采用本地模式启动Spark Shell的命令主要包含以下参数：
–master：这个参数表示当前的Spark Shell要连接到哪个master，如果是local[*]，就是使用本地模式启动spark-shell，其中，中括号内的星号表示需要使用几个CPU核心(core)；
–jars：这个参数用于把相关的JAR包添加到CLASSPATH中；如果有多个jar包，可以使用逗号分隔符连接它们；

通过下面命令启动spark-shell环境：

spark-shell

该命令省略了参数，这时，系统默认是“spark-shell –master local[*]”，也就是说，是采用本地模式运行，并且使用本地所有的CPU核心。

退出：

scala>:quit

原文

spark安装配置的更多相关文章

Hive on Spark安装配置详解（都是坑啊）
个人主页:http://www.linbingdong.com 简书地址:http://www.jianshu.com/p/a7f75b868568 简介本文主要记录如何安装配置Hive on Sp ...
centOS7下Spark安装配置
环境说明: 操作系统: centos7 64位 3台 centos7-1 192.168.190.130 master centos7-2 192.168.190.129 slave1 centos7 ...
ubuntu下spark安装配置
一.安装vmware虚拟机二.在虚拟机上安装ubuntu12.04操作系统三.安装jdk1.8.0_25 http://www.oracle.com/technetwork/java/javase ...
spark 安装配置
最佳参考链接 https://opensourceteam.gitbooks.io/bigdata/content/spark/install/spark-160-bin-hadoop26an_zhu ...
[Spark] Spark 安装配置
原文地址:https://www.cnblogs.com/memento/p/9148732.html Windows 上的单机版安装下载地址:http://spark.apache.org/dow ...
spark安装配置（scala不是必须的，基于java虚拟机，因此scala可以不配，但是开发需要可以配）
下载 http://spark.apache.org/downloads.html 下载2.3.1 https://blog.csdn.net/qq_15349687/article/details/ ...
Linux-Spark-Hadoop-Hive安装配置
1. JAVA安装配置:https://www.cnblogs.com/lamp01/p/8932740.html 2. Spark安装配置:https://www.cnblogs.com/vince ...
Windows环境中Openfire与Spark安装与配置指南
安装软件: openfire3.9.3 spark2.6.3 安装环境: WindowsXP JDK1.6.0_21 Oracle 一.openfire安装 1.安装openfire3.9.3,下载地 ...
spark集群安装配置
spark集群安装配置一. Spark简介 Spark是一个通用的并行计算框架,由UCBerkeley的AMP实验室开发.Spark基于map reduce 算法模式实现的分布式计算,拥有Hadoo ...

随机推荐

二、docker 镜像容器常用操作(让我们用docker 溜得飞起)
前言上篇讲了我们如何安装docker,现在该我们一展拳脚的时候了.接下来让我们一起学习一下docker常见的操作,让我们能够会使用 docker. 基本概念在讲使用之前,还是先将一下docker ...
metasploit(MSF)渗透平台命令大全
转自互联网记录以备后用 show exploits 列出metasploit框架中的所有渗透攻击模块. show payloads 列出metasploit框架中的所有攻击载荷. show auxi ...
msf利用- windows内核提权漏洞
windows内核提权漏洞环境: Kali Linux(攻击机) 192.168.190.141 Windows2003SP2(靶机) 192.168.190.147 0x01寻找可利用的exp 实 ...
Java反序列化漏洞总结
本文首发自https://www.secpulse.com/archives/95012.html,转载请注明出处. 前言什么是序列化和反序列化 Java 提供了一种对象序列化的机制,该机制中,一个 ...
Ubuntu php + apache
Ubuntu 环境: 问题1: apache 不能解析 *.php 文件安装apache的扩展模块 : apt-get install libapache2-mod-php 问题2 : 客户端访问 ...
PHP pa和ma
<?php class Mouse { private $color; public $sex; public function __construct($role){ switch($role ...
win server 2008R2 安装telnet 在VM虚拟机中
服务器端: 第一步: 安装telnet 先固定,ip地址,因为虚拟机之间通信需要同网段,所以先固定ip, 第二步: 服务管理器>功能>添加功能 >服务器上安装服务器端telnet ...
libevent::事件::定时器2
#define evtimer_new(b, cb, arg) event_new((b), -1, 0, (cb), (arg)) #include <cstdio> #include ...
python学习-语言概述（一）
1.python的特点 python是一种面向对象.解释型.弱类型的脚本语言,它也是一种功能强大而完善的通用型语言. 解释性语言的特点:速度慢:源代码加密困难:跨平台:
[AHOI2002]哈利·波特与魔法石
这道题比较简单,就是一个最短路(SSSP).数据水,用Floyd即可AC.这里用了Dijkstra. #include <iostream> #include <cstdio> ...

spark安装配置

spark安装配置的更多相关文章

随机推荐

热门专题