大数据处理框架之Strom:容错机制

1、集群节点宕机
Nimbus服务器
　　单点故障，大部分时间是闲置的，在supervisor挂掉时会影响，所以宕机影响不大，重启即可
非Nimbus服务器
　　故障时，该节点上所有Task任务都会超时，Nimbus会将这些Task任务重新分配到其他服务器上运行

2、进程挂掉
Worker
　　挂掉时，Supervisor会重新启动这个进程。如果启动过程中仍然一直失败，并且无法向Nimbus发送心跳，Nimbus会将该Worker重新分配到其他服务器上
Supervisor
　　无状态（所有的状态信息都存放在Zookeeper中来管理）
　　快速失败（每当遇到任何异常情况，都会自动毁灭）
Nimbus
　　无状态（所有的状态信息都存放在Zookeeper中来管理）
　　快速失败（每当遇到任何异常情况，都会自动毁灭）

3、消息的完整性
从Spout中发出的Tuple，以及基于他所产生Tuple，由这些消息就构成了一棵tuple树，当这棵tuple树发送完成，并且树当中每一条消息都被正确处理，就表明spout发送消息被“完整处理”，即消息的完整性，storm使用Acker确保消息完整性，Acker是拓扑当中特殊的一些任务，负责跟踪每个Spout发出的Tuple的DAG（有向无环图）
Acker分为ack确认机制和fail失败处理机制，Spout作为数据源，当拓扑中bolt处理失败时该怎么办？Acker机制可以重发数据到bolt进行重新处理。

看下面的例子：

MessageSpout ----> split-bolt ----> write-bolt

MessageTopology

package bhz.topology;

import backtype.storm.Config;

import backtype.storm.LocalCluster;

import backtype.storm.topology.TopologyBuilder;

import bhz.bolt.SpliterBolt;

import bhz.bolt.WriterBolt;

import bhz.spout.MessageSpout;

public class MessageTopology {

    public static void main(String[] args) throws Exception {

        TopologyBuilder builder = new TopologyBuilder();

        builder.setSpout("spout", new MessageSpout());

        builder.setBolt("split-bolt", new SpliterBolt()).shuffleGrouping("spout");

        builder.setBolt("write-bolt", new WriterBolt()).shuffleGrouping("split-bolt");

        //本地配置

        Config config = new Config();

        config.setDebug(false);

        LocalCluster cluster = new LocalCluster();

        System.out.println(cluster);

        cluster.submitTopology("message", config, builder.createTopology());

        Thread.sleep(10000);

        cluster.killTopology("message");

        cluster.shutdown();

    }

}

MessageSpout

package bhz.spout;

import java.util.Map;

import backtype.storm.spout.SpoutOutputCollector;

import backtype.storm.task.TopologyContext;

import backtype.storm.topology.IRichSpout;

import backtype.storm.topology.OutputFieldsDeclarer;

import backtype.storm.tuple.Fields;

import backtype.storm.tuple.Values;

public class MessageSpout implements IRichSpout {

    private static final long serialVersionUID = 1L;

    private int index = 0;

    private String[] subjects = new String[]{

            "groovy,oeacnbase",

            "openfire,restful",

            "flume,activiti",

            "hadoop,hbase",

            "spark,sqoop"

    };

    private SpoutOutputCollector collector;

    @Override

    public void open(Map conf, TopologyContext context, SpoutOutputCollector collector) {

        this.collector = collector;

    }

    @Override

    public void nextTuple() {

        if(index < subjects.length){

            String sub = subjects[index];

            //发送信息参数1 为数值， 参数2为msgId

            collector.emit(new Values(sub), index);

            index++;

        }

    }

    @Override

    public void declareOutputFields(OutputFieldsDeclarer declarer) {

        declarer.declare(new Fields("subjects"));

    }

    //当bolt 处理成功  ack确认 spout执行ack方法

    @Override

    public void ack(Object msgId) {

        System.out.println("【消息发送成功!!!】 (msgId = " + msgId +")");

    }

    //当bolt处理失败时，spout调用fail方法，进行重发处理

    @Override

    public void fail(Object msgId) {

        System.out.println("【消息发送失败!!!】  (msgId = " + msgId +")");

        System.out.println("【重发进行中...】");

        collector.emit(new Values(subjects[(Integer) msgId]), msgId);

        System.out.println("【重发成功!!!】");

    }

    @Override

    public void close() {

    }

    @Override

    public void activate() {

    }

    @Override

    public void deactivate() {

    }

    @Override

    public Map<String, Object> getComponentConfiguration() {

        return null;

    }

}

SpliterBolt

package bhz.bolt;

import java.util.ArrayList;

import java.util.HashMap;

import java.util.List;

import java.util.Map;

import backtype.storm.task.OutputCollector;

import backtype.storm.task.TopologyContext;

import backtype.storm.topology.IRichBolt;

import backtype.storm.topology.OutputFieldsDeclarer;

import backtype.storm.tuple.Fields;

import backtype.storm.tuple.Tuple;

import backtype.storm.tuple.Values;

public class SpliterBolt implements IRichBolt {

    private static final long serialVersionUID = 1L;

    private OutputCollector collector;

    @Override

    public void prepare(Map config, TopologyContext context, OutputCollector collector) {

        this.collector = collector;

    }

    private boolean flag = false;

    @Override

    public void execute(Tuple tuple) {

        try {

            String subjects = tuple.getStringByField("subjects");

            if(!flag && subjects.equals("flume,activiti")){

                flag = true;

                int a = 1/0;

            }

            String[] words = subjects.split(",");

            //List<String> list = new ArrayList<String>();

            //int index = 0;

            for (String word : words) {

                //注意这里循环发送消息，要携带tuple对象，用于处理异常时重发策略

                collector.emit(tuple, new Values(word));

                //list.add(word);

                //index ++;

            }

            //collector.emit(tuple, new Values(list));

            collector.ack(tuple);//通知spout处理成功

        } catch (Exception e) {

            e.printStackTrace();

            collector.fail(tuple);//通知spout 处理失败

        }

    }

    @Override

    public void declareOutputFields(OutputFieldsDeclarer declarer) {

        declarer.declare(new Fields("word"));

    }

    @Override

    public void cleanup() {

    }

    @Override

    public Map<String, Object> getComponentConfiguration() {

        return null;

    }

}

WriterBolt

package bhz.bolt;

import java.io.FileWriter;

import java.io.IOException;

import java.util.List;

import java.util.Map;

import backtype.storm.task.OutputCollector;

import backtype.storm.task.TopologyContext;

import backtype.storm.topology.IRichBolt;

import backtype.storm.topology.OutputFieldsDeclarer;

import backtype.storm.tuple.Tuple;

import backtype.storm.tuple.Values;

public class WriterBolt implements IRichBolt {

    private static final long serialVersionUID = 1L;

    private FileWriter writer;

    private OutputCollector collector;

    @Override

    public void prepare(Map config, TopologyContext context, OutputCollector collector) {

        this.collector = collector;

        try {

            writer = new FileWriter("d://message.txt");

        } catch (IOException e) {

            e.printStackTrace();

        }

    }

    private boolean flag = false;

    @Override

    public void execute(Tuple tuple) {

        String word = tuple.getString(0);

//        List<String> list = (List<String>)tuple.getValueByField("word");

//        System.out.println("======================" + list);

        try {

            if(!flag && word.equals("hadoop")){

                flag = true;

                int a = 1/0;

            }

            writer.write(word);

            writer.write("\r\n");

            writer.flush();

        } catch (Exception e) {

            e.printStackTrace();

            collector.fail(tuple);//通知spout处理失败

        }

        collector.emit(tuple, new Values(word));

        collector.ack(tuple);//通知spout处理成功

    }

    @Override

    public void cleanup() {

    }

    @Override

    public void declareOutputFields(OutputFieldsDeclarer declarer) {

    }

    @Override

    public Map<String, Object> getComponentConfiguration() {

        return null;

    }

}

spout重发机制会带来一个问题：数据重复消费，看上面的例子当WriterBolt执行失败的时候，spout 将hadoop,hbase重发，那么hbase会被WriterBolt再执行一次，目前storm对此没有保障机制，按照业务设计的通用做法就是使用幂等性（比如使用唯一性ID），防止重复消费数据。

大数据处理框架之Strom:容错机制的更多相关文章

大数据处理框架之Strom: Storm----helloword
大数据处理框架之Strom: Storm----helloword Storm按照设计好的拓扑流程运转,所以写代码之前要先设计好拓扑图.这里写一个简单的拓扑: 第一步:创建一个拓扑类含有main方法的 ...
大数据处理框架之Strom：认识storm
Storm是分布式实时计算系统,用于数据的实时分析.持续计算,分布式RPC等. (备注:5种常见的大数据处理框架:· 仅批处理框架:Apache Hadoop:· 仅流处理框架:Apache Stor ...
大数据处理框架之Strom: Storm拓扑的并行机制和通信机制
一.并行机制 Storm的并行度 ,通过提高并行度可以提高storm程序的计算能力. 1.组件关系:Supervisor node物理节点,可以运行1到多个worker,不能超过supervisor. ...
大数据处理框架之Strom：Flume+Kafka+Storm整合
环境虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk1.8 storm-0.9 apache-flume-1.6.0 ...
大数据处理框架之Strom：DRPC
环境虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk1.8 storm-0.9 一.DRPC DRPC:Distri ...
大数据处理框架之Strom:Storm集群环境搭建
搭建环境 Red Hat Enterprise Linux Server release 7.3 (Maipo) zookeeper-3.4.11 jdk1.7.0_80 Pyth ...
大数据处理框架之Strom：事务
环境虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk1.8 storm-0.9 apache-flume-1.6.0 ...
大数据处理框架之Strom：redis storm 整合
storm 引入redis ,主要是使用redis缓存库暂存storm的计算结果,然后redis供其他应用调用取出数据. 新建maven工程 pom.xml <project xmlns=&qu ...
大数据处理框架之Strom：kafka storm 整合
storm 使用kafka做数据源,还可以使用文件.redis.jdbc.hive.HDFS.hbase.netty做数据源. 新建一个maven 工程: pom.xml <project xm ...

随机推荐

使用Git，如何忽略不需要上传的文件（配置文件）
步骤1:在目录下,选择GIt Bash Here 2.输入命令 : git update-index --assume-unchanged 文件名 3.再输入指令 git status 查看修改文件 ...
django时间的时区问题（转）
add by zhj: 使用django时,如果设置USE_TZ=True,那django在数据库中存储的是0时区的时间:如果USE_TZ=False,那存储的是本地时间原文:https://www ...
腾讯游戏DBA团队的发展自白
BA这个岗位跟仓管员很像,就是每天给别人发点货,别人在你这儿放点货,DBA工作就是把货尽快给送出去或者让人家尽快放进来.当然,还有一份重要的工作,就是让仓库里摆放的货物尽可能整齐,这也是仓管员的本职工 ...
使用Python监控Linux系统
一.Python编写的监控工具一.多功能系统资源统计工具dstat 1.dstat介绍 dstat是一个用Python语言实现的多功能系统资源统计工具,用来取代Linux下的vmstat.iosta ...
react-router v4 使用 history 控制路由跳转
问题当我们使用react-router v3的时候,我们想跳转路由,我们一般这样处理我们从react-router导出browserHistory. 我们使用browserHistory.push ...
Please add or free up more resources then turn off safe mode manually.
解决方案:硬盘满了,释放硬盘空间.
比较两种方式的form请求提交
[一]浏览器form表单提交表单提交, 适用于浏览器提交.像常见的pc端的网银支付,用户在商户商城购买商品,支付时商家系统把交易数据通过form表单提交到三方支付网关,然后用户在三方网关页面完成支付 ...
Installshield2015 定制安装在C:\Program files 目录不正确问题
情境描述:安装时,选择定制安装,安装目录选择C:\Program Files,安装后文件并没有到C:\Program Files,而是安装到了C:\Program Files (x86)目录下. 原因 ...
es6函数的扩展
扩展运算符含义扩展运算符(spread)是三个点(...).它好比 rest 参数的逆运算,将一个数组转为用逗号分隔的参数序列. 扩展运算符的应用 (1)合并数组 // ES5 [1, 2].co ...
unity之让obj旋转自转等操作
1.让cube沿着矩形四个点运动 using System.Collections; using System.Collections.Generic; using UnityEngine; publ ...

大数据处理框架之Strom:容错机制

大数据处理框架之Strom:容错机制的更多相关文章

随机推荐

热门专题