Spark程序本地运行

本次安装是在JDK安装完成的基础上进行的！ SPARK版本和hadoop版本必须对应！！！

spark是基于hadoop运算的，两者有依赖关系，见下图：

前言：

1.环境变量配置：

1.1 打开“控制面板”选项

1.2.找到“系统”选项卡

1.3.点击“高级系统设置”

1.4.点击“环境变量”

2.新建和编辑环境变量

1.下载hadoop-2.6.0.tar.gz文件，并解压在本地

1.1 新建环境变量上配置

HADOOP_HOME

D:\JAVA\hadoop

1.2 修改PATH路径

$HADOOP_HOME/bin;

2.下载scala-2.10.6.zip文件，并解压在本地

2.1 新建环境变量上配置

SCALA_HOME
D:\JAVA\scala

2.2 修改PATH路径

%SCALA_HOME%\bin;%SCALA_HOME%\jre\bin;

3.下载spark-1.6.2-bin-hadoop2.6.tgz文件，并解压在本地

3.1 新建环境变量上配置

SPARK_HOME

D:\JAVA\spark_home\bin

3.2 修改PATH路径

PATH

$SPARK_HOME/bin;

4.下载scala-IDE.zip文件，并解压在本地

新建一个工程，修改library：

Scala library一定要是：2.10.X

新建一个自己的library：添加一个Jar文件（${spark_home}/lib）

下跟Word Count代码

package com

import org.apache.spark.SparkConf

import org.apache.spark.api.java.JavaSparkContext

import org.apache.spark.SparkContext

/**

 * 统计字符出现次数

 */

object WordCount {

  def main(args: Array[String]): Unit = {

         System.setProperty("hadoop.home.dir", "D:\\JAVA\\hadoop");

         val sc = new SparkContext("local", "My App")

         val line = sc.textFile("/srv/1.txt")

         line.map((_, 1)).reduceByKey(_+_).collect().foreach(println)

         sc.stop()

    println(111111)

  }

}

hadoop下载点击这里

spark下载点击这里

scala安装包，scala IDE下载点击这里

Spark程序本地运行的更多相关文章

spark 程序 windows 运行报错
1 java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries. at ...
spark window本地运行wordcount错误
在运行本地运行spark或者hadoop代码时可能会遇到一下三种问题 1.Exception in thread "main" java.lang.UnsatisfiedLin ...
在local模式下的spark程序打包到集群上运行
一.前期准备前期的环境准备,在Linux系统下要有Hadoop系统,spark伪分布式或者分布式,具体的教程可以查阅我的这两篇博客: Hadoop2.0伪分布式平台环境搭建 Spark2.4.0伪分 ...
scala IDE for Eclipse开发Spark程序
1.开发环境准备 scala IDE for Eclipse:版本(4.6.1) 官网下载:http://scala-ide.org/download/sdk.html 百度云盘下载:链接:http: ...
初识Spark程序
执行第一个spark程序普通模式提交任务: bin/spark-submit \ --class org.apache.spark.examples.SparkPi \ --master spark ...
[Spark]如何设置使得spark程序不输出 INFO级别的内容
Spark程序在运行的时候,总是输出很多INFO级别内容查看了网上的一些文章,进行了试验. 发现在 /etc/spark/conf 目录下,有一个 log4j.properties.template ...
spark之scala程序开发(本地运行模式)：单词出现次数统计
准备工作: 将运行Scala-Eclipse的机器节点(CloudDeskTop)内存调整至4G,因为需要在该节点上跑本地(local)Spark程序,本地Spark程序会启动Worker进程耗用大量 ...
如何在本地使用scala或python运行Spark程序
如何在本地使用scala或python运行Spark程序包含两个部分: 本地scala语言编写程序,并编译打包成jar,在本地运行. 本地使用python语言编写程序,直接调用spark的接口, ...
Spark认识&环境搭建&运行第一个Spark程序
摘要:Spark作为新一代大数据计算引擎,因为内存计算的特性,具有比hadoop更快的计算速度.这里总结下对Spark的认识.虚拟机Spark安装.Spark开发环境搭建及编写第一个scala程序.运 ...

随机推荐

JAVA实现WC.exe功能
项目要求实现一个统计程序,它能正确统计程序文件中的字符数.单词数.行数,以及还具备其他扩展功能,并能够快速地处理多个文件. 具体功能要求: 程序处理用户需求的模式为: wc.exe [paramet ...
如何使用T-SQL备份还原数据库及c#如何调用执行？
准备材料:Microsoft SQL Server一部.需要还原的bak文件一只一.备份数据库备份语句:user master backup database 数据库名 to disk='保存路径 ...
【NumberValidators】增值税发票代码验证
同大陆身份证验证一样,该部分是按照国家增值税发票代码的定制规则,进行发票代码验证,如果需要查验发票信息是否正确,应该通过第三方接口(大约一毛钱查验一次),或者直接上国家税务总局全国增值税发票查验平台进 ...
C#之使用CefSharp创建客户端
安装NuGet包在Visio studio中右击解决方案,选择管理NuGet包,搜索安装CefSharp.WinForms. 配置工作 (1)首先右击项目选择属性,在"生成"选项 ...
winform NPOI excel 导出并选择保存文件路径
public void ExcelOp(DataGridView gdv,ArrayList selHead) { if (selHead.Count==0) { MessageBox.Show(&q ...
使用FFMpeg命令行录屏推rtmp流
最近在做局域网内屏幕分享方面的东西,要把录制一台设备的屏幕然后实时推送给内网的一个或多个用户. 做了很多实验,效果还没有达到要求,这里分享一下推rtmp流的实验. 实验使用到的各种工具:FFmpeg. ...
day 69 ORM 多表增删改查操作
http://www.cnblogs.com/liwenzhou/p/8660826.html 下面的代码是在 python console中配置的. 关闭pycharm会消失. from app01 ...
C/C++ 语言 Hello world
#include <stdio.h> void main() { int x,i; ; scanf("%d",&x); if(x>y) printf(&q ...
程序猿的日常——SpringMVC系统架构与流程回顾
web开发经历了很漫长的时间,在国内也快有十几年的时间了.从最开始的进程级到现在的MVC经历了很多的改进和优化,本篇就主要复习了解下Spring MVC相关的知识. 发展历程第一阶段 CGI进程响应 ...
jQuery核心函数的四种不同用法
核心函数根据实参的不同,有四种不同的用法. ①传一个函数作为参数例如:$(function(){}) 作用:和window.onload = function(){}类似,它会在文档加载完成之后运行 ...

Spark程序本地运行

Spark程序本地运行

本次安装是在JDK安装完成的基础上进行的！ SPARK版本和hadoop版本必须对应！！！

1.环境变量配置：

2.新建和编辑环境变量

1.下载hadoop-2.6.0.tar.gz文件，并解压在本地

2.下载scala-2.10.6.zip文件，并解压在本地

3.下载spark-1.6.2-bin-hadoop2.6.tgz文件，并解压在本地

4.下载scala-IDE.zip文件，并解压在本地

Spark程序本地运行的更多相关文章

随机推荐

热门专题