spark-shell解析

spark-shell 作用：

调用spark-submit脚本，如下参数 --classorg.apache.spark.repl.Main --name "Spark shell" "$@"，如下：

具体流程是：

#1 捕获终端信号，执行退出方法，恢复一些操作

#2 保存终端配置，当cygwin时关闭回显，之后再恢复

#3 执行spark-submit，调用repl.Main

#先检测系统是否属于cygwin,即是否为windows系统

#-------uname在Centos中是Liunx,使用uname -r 可以查看内核版本； 使用uname -a 可以查看所有的信息

cygwin=false

case"`uname`" in 

  CYGWIN*) cygwin=true;;

esac

#-------post设置shell的模式为POSIX标准模式，不同的模式对于一些命令和操作不一样。

set-o posix

#如果没有设置SPARK_HOME，shell会将当前脚本的上一级目录做为spark_home

# -z表示当串长度为0时，条件为真。  而$()和`` 都表示在shell中执行命令同时将结果返回

if [-z "${SPARK_HOME}" ]; then

  export SPARK_HOME="$(cd "`dirname"$0"`"/..; pwd)"

fi

#这段的意思是因为scala默认不会使用java classpath，因此这里需要手动设置一下，让scala使用java。

SPARK_SUBMIT_OPTS="$SPARK_SUBMIT_OPTS-Dscala.usejavacp=true"

function main() {

if $cygwin; then

stty -icanon min 1 -echo > /dev/null2>&1

exportSPARK_SUBMIT_OPTS="$SPARK_SUBMIT_OPTS -Djline.terminal=unix"

"${SPARK_HOME}"/bin/spark-submit--class org.apache.spark.repl.Main --name "Spark shell""$@"

stty icanon echo > /dev/null 2>&1

else

#如果不是cygwin系统，执行spark_home/bin/spark-submit的脚本，指定--class是org.apache.spark.repl.Main

#spark_shell 后面通常会跟着--master spark://host:7077

export SPARK_SUBMIT_OPTS

"${SPARK_HOME}"/bin/spark-submit--class org.apache.spark.repl.Main --name "Spark shell""$@"

}

exit_status=127

saved_stty=""

#restore stty settings (echo in particular)

functionrestoreSttySettings() {

stty $saved_stty

saved_stty=""

}

functiononExit() {

if [[ "$saved_stty" != ""]]; then

restoreSttySettings

exit $exit_status

}

# toreenable echo if we are interrupted before completing.

#这句是说，捕获INT信号，INT表示中断线程或进程，就会回调执行onExit方法。onExit中判断是否恢复终端设置。

trap onExit INT

#save terminal settings http://www.cnblogs.com/xing901022/p/6415289.html

######改变终端的显示，比如说关闭一些按键，开启一些特殊字符的输入等等。

#----stty-g 表示将当前终端的回显保存起来（stty -g，--save 表示以stty可读的方式打印当前所有设置）

saved_stty=$(stty-g 2>/dev/null)

#clear on error so we don't later try to restore them

#-----如果stty -g执行错误，需要将saved_stty设置成空串

if[[ ! $? ]]; then

saved_stty=""

#######此处会将spark-shell后面的所有参数，都给main方法

main"$@"

######################################################

#运行test.sh 1 2 3后

# "$*"的意思为"1 2 3"（一起被引号包住）

# "$@"为"1""2" "3"（分别被包住,好处就是传给main方法就不用再做切分了）

# $#:表示脚本参数个数

######################################################

#record the exit status lest it be overwritten:

#then reenable echo and propagate the code.

exit_status=$?

onExit

本文转自：https://blog.csdn.net/luyllyl/article/details/79554580

spark-shell解析的更多相关文章

Spark shell的原理
Spark shell是一个特别适合快速开发Spark原型程序的工具,可以帮助我们熟悉Scala语言.即使你对Scala不熟悉,仍然可以使用这个工具.Spark shell使得用户可以和Spark集群 ...
Spark:使用Spark Shell的两个示例
Spark:使用Spark Shell的两个示例 Python 行数统计 ** 注意: **使用的是Hadoop的HDFS作为持久层,需要先配置Hadoop 命令行代码 # pyspark >& ...
Spark源码分析之Spark Shell（上）
终于开始看Spark源码了,先从最常用的spark-shell脚本开始吧.不要觉得一个启动脚本有什么东东,其实里面还是有很多知识点的.另外,从启动脚本入手,是寻找代码入口最简单的方法,很多开源框架,其 ...
Spark源码分析之Spark Shell（下）
继上次的Spark-shell脚本源码分析,还剩下后面半段.由于上次涉及了不少shell的基本内容,因此就把trap和stty放在这篇来讲述. 上篇回顾:Spark源码分析之Spark Shell(上 ...
shell解析命令行的过程以及eval命令
本文说明的是一条linux命令在执行时大致要经过哪些过程?以及这些过程的大致顺序. 1.1 shell解析命令行 shell读取和执行命令时的大致操作过程如下图: 以执行以下命令为例: echo -e ...
[Spark内核] 第36课：TaskScheduler内幕天机解密：Spark shell案例运行日志详解、TaskScheduler和SchedulerBackend、FIFO与FAIR、Task运行时本地性算法详解等
本課主題通过 Spark-shell 窥探程序运行时的状况 TaskScheduler 与 SchedulerBackend 之间的关系 FIFO 与 FAIR 两种调度模式彻底解密 Task 数据 ...
使用shell解析脚本依赖关系，并自动补数
将脚本依赖关系放到表中使用shell解析脚本依赖关系,递归的计算各个脚本. #!/bin/bash # dm 补数 basepath=$(cd ``; pwd) cd $basepath sourc ...
【原创 Hadoop&Spark 动手实践 5】Spark 基础入门，集群搭建以及Spark Shell
Spark 基础入门,集群搭建以及Spark Shell 主要借助Spark基础的PPT,再加上实际的动手操作来加强概念的理解和实践. Spark 安装部署理论已经了解的差不多了,接下来是实际动手实 ...
[Spark Core] Spark Shell 实现 Word Count
0. 说明在 Spark Shell 实现 Word Count RDD (Resilient Distributed dataset), 弹性分布式数据集. 示意图 1. 实现 1.1 分步实现 ...
【大数据】Spark内核解析
1. Spark 内核概述 Spark内核泛指Spark的核心运行机制,包括Spark核心组件的运行机制.Spark任务调度机制.Spark内存管理机制.Spark核心功能的运行原理等,熟练掌握Spa ...

随机推荐

OC和C语言比较
说明:比较记忆相对来说更容易熟练记得牢固,理解了C语言相对来说OC也不太难,OC是C语言的扩展,向下兼容C语言. 源文件后缀名比较 1.C语言源文件 .h:头文件 .c:源文件 .o:目标文件 .ou ...
iOS应用启动原理图解及ARC强弱引用
iOS应用启动原理图解(红色箭头表示strong强引用,绿色箭头代表weak若引用) 只要将UI控件拖到Storyboard里控制器的大view上,Xcode会自动将这些控件以强引用的形式加入到sel ...
安全清理Xcode 缓存垃圾
安全清理Xcode缓存垃圾方法: 经验证,Xcode缓存垃圾存储在~/Library/Developer/Xcode/DerivedData/路径下,缓存和Xcode的版本有关(如同一台Mac安装2个 ...
Memcache随笔
Tip01: Memcache 中记录的缓存如果你设置了失效时间,之后如果你在系统时间中将时间修改为超过失效时间,再次访问之前你设置的资源,Memcache 会认为你设置的缓存已失效: Tip02: ...
严重: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.LifecycleException: Failed to start component
自己写了个最简单的springMVC项目练练手,没有用maven,在WebContent中新建了lib文件夹,将jar包复制到这里面,然后add to build path到项目里. 启动Tomcat ...
BufPay.com 个人收款接口接入步骤
作为独立开发者产品需要收款是非常麻烦的,注册公司维护成本太高,市面上各种收款工具要么手续费太高,要么到账很慢,体验很不好. 看到「BufPay.com 个人收款」这个收款工具,挺有意思的.原理是监 ...
SpringBoot整合Mybatis,TypeAliases配置失败的问题
SpringBoot整合Mybatis,TypeAliases配置失败的问题问题描述在应用MyBatis时,使用对象关系映射,将对象和Aliase映射起来. 在Mybatis的文档明确写出,如果你 ...
Django的MVT的思路
1.先上两张图片 2.我的理解 view在MVT框架里面,起到的是中间调度的作用. a.在diango里面有个关键性路径的配置就是在django2.0前的url和在2.0后的path. 为避免一个项 ...
flume搭建新手测试环境
硬件环境: 腾讯云,两台服务器8G 双核软件环境: flume1.8.jdk1.8,centos6 第一次搭建也是各种找文件,只知道flume是日志抓取服务,也听说了非常稳定强大的服务,正好公司需要 ...
Celery的基本使用
Celery 1.什么是Celery Celery是一个简单.灵活且可靠的,处理大量消息的分布式系统,专注于实时处理的异步任务队列,同时也支持任务调度. 用Python写的执行定时任务和异步任务的框 ...

spark-shell解析

spark-shell解析的更多相关文章

随机推荐

热门专题