spark一些入门资料
spark一些入门资料
A Scala Tutorial for Java Programmers
http://docs.scala-lang.org/tutorials/scala-for-java-programmers.html
学习资源(视频教程,书,样例等)
spark.apache.org/documentation.html
入门指南
spark.apache.org/docs/latest/quick-start.html
编程指南
spark.apache.org/docs/latest/programming-guide.html
官网自带样例(极好,有local版。有spark版)
https://github.com/apache/spark/tree/master/examples/src/main/scala/org/apache/spark/examples
运行spark应用(利用spark-submit命令。事实上最底层是java调用)
spark.apache.org/docs/latest/submitting-applications.html
./spark-submit --class"SimpleApp" --master local[4] /home/linger/scala_target/SimpleApp.jar
运行官网自带的example能够利用run-example。该脚本封装了spark-submit命令。
run-example脚本有这么一句 EXAMPLE_MASTER=${MASTER:-"local[*]"}默认master是local[*]。
依据这句shell,能够有一个方法改变着master。
在调用该脚本之前,export MASTER=local(或者其它)。
眼下不知道是否还有其它方法传递MASTER这个变量。
spark 开发环境搭建(不错)
http://blog.csdn.net/wankunde/article/details/41843217
http://bit1129.iteye.com/blog/2172164
设置完毕后,Error视图报错。说Eclipse依赖的Scala库有两份,一个是系统安装的Scala(C:\Scala_2.11.4,一个是spark-assembly-1.2.0-hadoop2.4.0.jar中,而spark-assembly-1.2.0-hadoop2.4.0.jar中的版本号是2.10.4。因此两个版本号不一致而导致冲突
由于我们的代码是在Spark中执行。而Spark使用的Scala版本号是2.10.4。所以。开发环境中的Scala也应该是2.10.4。因此将2.11.4这个Scala库从Java Build Path删除掉
删除了之后。Eclipse继续报错,例如以下所看到的,也就是说。项目依赖的Scala版本号不如IDE的Scala版本号新。解决的方法例如以下
右击前面建的Scala项目,在右键弹出菜单中。选择Scala。然后在级联菜单中,选择Set Scala Installation,在弹出的对话框中选择,Fixed Scala Installation:2.10.4(bundled)
clean整个项目,Scala IDE的环境到此就配置完毕了。
scala-eclipse执行出现错误
java.lang.ClassNotFoundException
scala-ide
http://scala-ide.org/download/sdk.html
sbt是scala的构建工具
www.scala-sbt.org/documentation.html
sbt安装有点坑啊,安装完之后启动sbt还要下载东西
http://www.zhihu.com/question/23245141
SBT免FQ手冊
http://afoo.me/posts/2014-11-05-how-make-sbt-jump-over-GFW.html
离线环境下构建sbt项目
http://shzhangji.com/blog/2014/11/07/sbt-offline/
Scala SBT 第一次执行时下载文件失败
http://mooc.guokr.com/note/5879/
http://segmentfault.com/blog/zhongl/1190000002474507
加速 SBT 下载依赖库的速度
http://ju.outofmemory.cn/entry/74281
问候sbt一千遍之:加入全局镜像库
spark和机器学习技术博客
http://www.cnblogs.com/fxjwind/
--------------------------------------------------------------------------------------------------------------------
Spark执行调试方法与学习资源汇总
http://blog.csdn.net/melodyishere/article/details/32353929
IntelliJ IDEA 安装scala插件。建立scalawith sbt project 的方法
http://8liang.cn/intellijidea-install-scala-plugin-create-with-sbt-project/
Apache spark的IntelliJ IDEA 开发环境搭建
http://8liang.cn/intellij-idea-spark-development/
Spark作业代码(源代码)IDE远程调试
http://www.iteblog.com/archives/1192
利用eclipse构建spark集成开发环境
http://datalab.int-yt.com/archives/505
Apache Spark学习:利用Eclipse构建Spark集成开发环境
http://dongxicheng.org/framework-on-yarn/spark-eclipse-ide/
spark一些配置信息
http://spark.apache.org/docs/latest/configuration.html
本文作者:linger
本文链接:http://blog.csdn.net/lingerlanlan/article/details/46430915
spark一些入门资料的更多相关文章
- Spark快速入门
Spark 快速入门 本教程快速介绍了Spark的使用. 首先我们介绍了通过Spark 交互式shell调用API( Python或者scala代码),然后演示如何使用Java, Scala或者P ...
- 【转载】Spark学习——入门
要学习分布式以及数据分析.机器学习之类的,觉得可以通过一些实际的编码项目入手.最近Spark很火,也有不少招聘需要Spark,而且与传统的Hadoop相比,Spark貌似有一些优势.所以就以Spark ...
- Git入门资料汇总
Git是一个非常好用的版本控制工具,同时,它也是一个相对比较复杂的工具,想要掌握它还是需要花一番功夫的.网络上关于Git的入门资料已经很多了,我就不再重复了,直接把我学习的文章放在这里. Git详解 ...
- Spark快速入门 - Spark 1.6.0
Spark快速入门 - Spark 1.6.0 转载请注明出处:http://www.cnblogs.com/BYRans/ 快速入门(Quick Start) 本文简单介绍了Spark的使用方式.首 ...
- 【原创 Hadoop&Spark 动手实践 5】Spark 基础入门,集群搭建以及Spark Shell
Spark 基础入门,集群搭建以及Spark Shell 主要借助Spark基础的PPT,再加上实际的动手操作来加强概念的理解和实践. Spark 安装部署 理论已经了解的差不多了,接下来是实际动手实 ...
- 转:UFLDL_Tutorial 笔记(deep learning绝佳的入门资料 )
http://blog.csdn.net/dinosoft/article/details/50103503 推荐一个deep learning绝佳的入门资料 * UFLDL(Unsupervised ...
- spark streaming 入门例子
spark streaming 入门例子: spark shell import org.apache.spark._ import org.apache.spark.streaming._ sc.g ...
- GIT(2)----入门资料,分支管理,冲突解决
最近一直使用者GIT发现使用起来确实很不错,最近做些整理总结,发现了一些很不错的资料,收集在这里,以备忘. GIT入门挺简单的,之前有些过一篇文章,关于GIT的,但是都是一些生硬的操作,并没有系统的学 ...
- Spark高速入门指南(Quick Start Spark)
版权声明:本博客已经不再更新.请移步到Hadoop技术博客:https://www.iteblog.com https://blog.csdn.net/w397090770/article/detai ...
随机推荐
- django-4-模板标签,模板继承
<<<模板标签>>> {% for %}{% endfor %} 循环 {% if %}{% elif %}{% else %}{% endif %} 判断 {% ...
- JavaScript 常见创建对象的方式
JavaScript 有哪几种创建对象的方式? javascript创建对象简单的说,无非就是使用内置对象或各种自定义对象,当然还可以用JSON:但写法有很多种,也能混合使用. (1)对象字面量的方式 ...
- 前端通过canvas实现图片压缩
在一次的项目中,需要用户上传图片,目前市场随便一个手机拍出来的照片都是好几兆,直接上传特别占用带宽,影响用户体验,所以要求对用户上传图片进行压缩后再上传:那么前端怎么实现这个功能呢? 亲测可将4M图片 ...
- linux内核(一)基础知识
1,linux内核的基础知识 1.1 linux内核版本 从内核源码顶层目录Makefile中可以看到: VERSION和PATCHLEVEL组成主版本号,比如2.4.2.5.2.6等,稳定版本的德主 ...
- Http请求和相应模式(B/S)(1)
B/S模式 服务器端的接受数据 :浏览器端 表单格式 <form></form> GET:请求方式, /index.html Web浏览器上的资源路径 uname=bjxt& ...
- 洛谷——P2822 组合数问题
https://www.luogu.org/problem/show?pid=2822 题目描述 组合数C_n^mCnm表示的是从n个物品中选出m个物品的方案数.举个例子,从(1,2,3) 三 ...
- Linux下基于多线程的echo
准备开始写一些Linux 下网络编程以及多线程的blog,就从这个简单的echo程序开始吧. 在echo的服务端使用多线程与客户进行通信,可以实现一个服务端程序同时连接多个客户的功能.那么,到底在服务 ...
- HDU 4310 Contest 2
贪心,注意排序条件. #include <iostream> #include <cstdio> #include <algorithm> using namesp ...
- 小胖说事30------iOS 强制转成横屏的方式
一直遇到这个问题,今天最终找到了解决方法. 在我们的项目中常常遇到横竖屏切换,而又有某个特定的界面必须是特定的显示方式(横屏或竖屏).这就须要例如以下的处理了. 强制转成横屏: if ([[UIDev ...
- Wireshark默认不抓取本地包的解决方式
事实上这个工具我已经用过非常多年了,还叫Ethereal的时候就在用. 今天因为实验须要,要抓一下在localhost间的包,结果发现获取不到.解决方法也非常easy,在cmd下输入: route a ...