如何优雅地停止Spark Streaming Job

　　由于streaming流程序一旦运行起来，基本上是无休止的状态，除非是特殊情况，否则是不会停的。因为每时每刻都有可能在处理数据，如果要停止也需要确认当前正在处理的数据执行完毕，并且不能再接受新的数据，这样才能保证数据不丢不重。

　　同时，也由于流程序比较特殊，所以也不能直接kill -9这种暴力方式停掉，直接kill的话，就有可能丢失数据或者重复消费数据。

　　下面介绍如何优雅的停止streaming job。

　　第一种：人工手动停止

　　程序里设置如下参数：

sparkConf.set("spark.streaming.stopGracefullyOnShutdown","true")//优雅的关闭

　　然后按照下面步骤操作
- 通过Hadoop 8088页面找到运行的程序
- 打开spark UI的监控页面
- 打开executor的监控页面
- 登录Linux找到驱动节点所在的机器IP以及运行的端口号
- 然后执行一个封装好的命令
```
sudo ss -tanlp |  grep 5555 |awk '{print $6}'|awk  -F, '{print $2}' | sudo  xargs kill -15
```

　　　　这种方式显然是比较复杂的。

　　第二种：使用HDFS系统做消息通知

　　　　在驱动程序中，加上一段代码，作用就是每隔一段时间扫描HDFS上一个文件，如果发现这个文件存在，就调用StreamContext的Stop方法，优雅的停止程序。

　　　　这里的HDFS可以换成reids、zk、hbase、db，唯一的问题就是依赖了外部的一个存储系统来达到消息通知的目的。

　　　　使用这种方式，停止程序就比较简单。登录有HDFS客户端的机器，然后touch一个空文件到指定目录，等到间隔的扫描时间，发现有文件存在，就需要关闭程序了。

　　　　废话不多说，上代码

    ssc.start()

    //check interval

    val checkIntervalMillis = 15000

    var isStopped = false

    println("before while")

    while (!isStopped) {

      println("calling awaitTerminationOrTimeout")

      isStopped = ssc.awaitTerminationOrTimeout(checkIntervalMillis)

      if (isStopped)

        println("confirmed! The streaming context is stopped. Exiting application...")

      else

        println("Streaming App is still running.")

      println("check file exists")

      if (!stopFlag) {

        val fs = FileSystem.get(new URI("hdfs://192.168.156.111:9000"),new Configuration())

        stopFlag = fs.exists(new Path("/stopMarker/marker"))

      }

      if (!isStopped && stopFlag) {

        println("stopping ssc right now")

        ssc.stop(true, true)

      }

    }

　　第三种：内部暴露一个socket或者http端口用来接收请求，等待除法关闭流程序

　　　　这种方式需要在driver启动一个socket线程，或者http服务。比较推荐使用http服务，因为socket有点偏底层，处理起来稍微复杂。

　　　　如果使用http服务，可以直接用内嵌的jetty，对外暴露一个http接口。Spark UI页面用的也是内嵌的jetty提供服务，所以不需要在pom文件引入额外的依赖，在关闭的时候，找到驱动所在的IP，就可以直接通过crul或者浏览器直接关闭流程序

　　　　找到驱动程序所在的IP，可以在程序启动的log中看到，也可以在spark master UI界面上找到，这种方式不依赖任何的存储系统，仅仅在部署的时候需要一个额外的端口号暴露http服务。

推荐使用第二种或第三种，如果想最大程度的减少对外部系统的依赖，推荐使用第三种。

参考文档：https://www.linkedin.com/pulse/how-shutdown-spark-streaming-job-gracefully-lan-jiang

如何优雅地停止Spark Streaming Job的更多相关文章

Spark 学习笔记之优雅地关闭Spark Streaming
优雅地关闭Spark Streaming: 当touch stop文件后,程序仍然会再执行一次,执行完成后退出.
Spark Streaming中空RDD处理及流处理程序优雅的停止
本期内容 : Spark Streaming中的空RDD处理 Spark Streaming程序的停止由于Spark Streaming的每个BatchDuration都会不断的产生RDD,空RDD ...
Spark Streaming官方文档学习--下
Accumulators and Broadcast Variables 这些不能从checkpoint重新恢复如果想启动检查点的时候使用这两个变量,就需要创建这写变量的懒惰的singleton实例 ...
4. Spark Streaming解析
4.1 初始化StreamingContext import org.apache.spark._ import org.apache.spark.streaming._ val conf = new ...
周期性清除Spark Streaming流状态的方法
在Spark Streaming程序中,若需要使用有状态的流来统计一些累积性的指标,比如各个商品的PV.简单的代码描述如下,使用mapWithState()算子: val productPvStrea ...
Storm介绍及与Spark Streaming对比
Storm介绍 Storm是由Twitter开源的分布式.高容错的实时处理系统,它的出现令持续不断的流计算变得容易,弥补了Hadoop批处理所不能满足的实时要求.Storm常用于在实时分析.在线机器学 ...
Spark Streaming消费Kafka Direct方式数据零丢失实现
使用场景 Spark Streaming实时消费kafka数据的时候,程序停止或者Kafka节点挂掉会导致数据丢失,Spark Streaming也没有设置CheckPoint(据说比较鸡肋,虽然可以 ...
Spark Streaming
Spark Streaming Spark Streaming 是Spark为了用户实现流式计算的模型. 数据源包括Kafka,Flume,HDFS等. DStream 离散化流(discretize ...
Spark Streaming官方文档学习--上
官方文档地址:http://spark.apache.org/docs/latest/streaming-programming-guide.html Spark Streaming是spark ap ...

随机推荐

松软科技web课堂:JavaScript 数组迭代方法
数组迭代方法对每个数组项进行操作,听着挺高深,其实,就是对数组对象一次性逐一进行一种操作的一种叫法.(文章来源:www.sysoft.net.cn,加v:15844800162深度交流) Array. ...
HbaseShell启动
找到hbase目录进入bin目录 ./hbase shell 成功
php number_format金钱价格格式处理由分单位转换成元（保留2为小数）
/** * priceFormat * 价格格式处理 * * @access public * @param null * @since 1.0 * @return object */ if(!fun ...
[Go] 时序数据库influxdb的安装
日志类的数据时候存储在时序数据库中,下面就是时序数据库influxdb的安装 curl -sL https://repos.influxdata.com/influxdb.key | apt-key ...
Python爬虫（学习准备）
编码格式的认识: 字符:各种文字和符号的统称字符集:多个字符的集合字符集包括:ASCII字符集,GB2312字符集,GB18030,Unicode字符集等 1个字符ASCII编码占1个字节,用Un ...
扩展KMP笔记
KMP能计算一个字符串的每个位置前最长公共前缀后缀扩展KMP可以用来计算两个字符串间的最长公共前缀后缀的…… 不过为了计算这个需要绕些弯路已知字符串$S$和$P$,$S$的长度为$n$,$P$的长 ...
python将图片旋转，颠倒，修改尺寸
直接上代码,根据需求注释选择相应修改 from PIL import Image import os import os.path rootdir = r'G:\jianfeng\project\ru ...
C#开发BIMFACE系列20 服务端API之获取模型数据5：批量获取构件属性
系列目录 [已更新最新开发文章,点击查看详细] 在<C#开发BIMFACE系列18 服务端API之获取模型数据3:获取构件属性>中介绍了获取单个文件/模型的单个构建的属性,本篇介绍 ...
mysql和oracle分页
mysql分页关键字limit,limit m,n 其中m表示起始位置的下标,下标从0开始.n表示要显示的条数,比如要查询一个表的第2到5条数据. ,; oracle分页关键字rownum, ro ...
Pytorch创建模型的多种方法
目录 Method 1 Method 2 Method 3 Method 4 Reference 网络结构: conv --> relu --> pool --> FC -- > ...

如何优雅地停止Spark Streaming Job

如何优雅地停止Spark Streaming Job的更多相关文章

随机推荐

热门专题