BasicDRPCTopology

main函数

DRPC 分布式远程调用(这个说法有意思,远程调用本来就是分布的,何须再加个D, <头文字D>看多了, :)

public static void main(String[] args) throws Exception {

    LinearDRPCTopologyBuilder builder = new LinearDRPCTopologyBuilder("exclamation");

    builder.addBolt(new ExclaimBolt(), 3);

    Config conf = new Config();

    if (args == null || args.length == 0) {

      LocalDRPC drpc = new LocalDRPC();

      LocalCluster cluster = new LocalCluster();

      cluster.submitTopology("drpc-demo", conf, builder.createLocalTopology(drpc));

      for (String word : new String[]{ "hello", "goodbye" }) {

        System.out.println("Result for \"" + word + "\": " + drpc.execute("exclamation", word));

      }

      cluster.shutdown();

      drpc.shutdown();

    }

    else {

      conf.setNumWorkers(3);

      StormSubmitter.submitTopology(args[0], conf, builder.createRemoteTopology());

    }

  }

问题: 上面的代码中只是添加了一个bolt,并没有设定Spout. 我们知道一个topology中最起码得有一个Spout,那么这里的Spout又隐身于何处呢?

关键的地方就在builder.createLocalTopology, 调用关系如下

LinearDRPCTopologyBuilder::createLocalTopology
- 　　LinearDRPCTopologyBuilder::createTopology()
  - 　　LinearDRPCTopologyBuilder::createTopology(new DRPCSpout(_function))

原来DRPCTopology中使用的Spout是DRPCSpout.

LinearDRPCTopology::createTopology

既然代码已经读到此处,何不再进一步看看createTopology的实现.

简要说明一下该段代码的处理逻辑:

设置DRPCSpout
以bolt为入参,创建CoordinatedBolt
添加JoinResult Bolt
添加ReturnResult Bolt: ReturnResultBolt连接到DRPCServer,并返回结果

    private StormTopology createTopology(DRPCSpout spout) {

        final String SPOUT_ID = "spout";

        final String PREPARE_ID = "prepare-request";

        TopologyBuilder builder = new TopologyBuilder();

        builder.setSpout(SPOUT_ID, spout);

        builder.setBolt(PREPARE_ID, new PrepareRequest())

                .noneGrouping(SPOUT_ID);

        int i=0;

        for(; i<_components.size();i++) {

            Component component = _components.get(i);

            Map<String, SourceArgs> source = new HashMap<String, SourceArgs>();

            if (i==1) {

                source.put(boltId(i-1), SourceArgs.single());

            } else if (i>=2) {

                source.put(boltId(i-1), SourceArgs.all());

            }

            IdStreamSpec idSpec = null;

            if(i==_components.size()-1 && component.bolt instanceof FinishedCallback) {

                idSpec = IdStreamSpec.makeDetectSpec(PREPARE_ID, PrepareRequest.ID_STREAM);

            }

            BoltDeclarer declarer = builder.setBolt(

                    boltId(i),

                    new CoordinatedBolt(component.bolt, source, idSpec),

                    component.parallelism);

            for(Map conf: component.componentConfs) {

                declarer.addConfigurations(conf);

            }

            if(idSpec!=null) {

                declarer.fieldsGrouping(idSpec.getGlobalStreamId().get_componentId(), PrepareRequest.ID_STREAM, new Fields("request"));

            }

            if(i==0 && component.declarations.isEmpty()) {

                declarer.noneGrouping(PREPARE_ID, PrepareRequest.ARGS_STREAM);

            } else {

                String prevId;

                if(i==0) {

                    prevId = PREPARE_ID;

                } else {

                    prevId = boltId(i-1);

                }

                for(InputDeclaration declaration: component.declarations) {

                    declaration.declare(prevId, declarer);

                }

            }

            if(i>0) {

                declarer.directGrouping(boltId(i-1), Constants.COORDINATED_STREAM_ID);

            }

        }

        IRichBolt lastBolt = _components.get(_components.size()-1).bolt;

        OutputFieldsGetter getter = new OutputFieldsGetter();

        lastBolt.declareOutputFields(getter);

        Map<String, StreamInfo> streams = getter.getFieldsDeclaration();

        if(streams.size()!=1) {

            throw new RuntimeException("Must declare exactly one stream from last bolt in LinearDRPCTopology");

        }

        String outputStream = streams.keySet().iterator().next();

        List<String> fields = streams.get(outputStream).get_output_fields();

        if(fields.size()!=2) {

            throw new RuntimeException("Output stream of last component in LinearDRPCTopology must contain exactly two fields. The first should be the request id, and the second should be the result.");

        }

        builder.setBolt(boltId(i), new JoinResult(PREPARE_ID))

                .fieldsGrouping(boltId(i-1), outputStream, new Fields(fields.get(0)))

                .fieldsGrouping(PREPARE_ID, PrepareRequest.RETURN_STREAM, new Fields("request"));

        i++;

        builder.setBolt(boltId(i), new ReturnResults())

                .noneGrouping(boltId(i-1));

        return builder.createTopology();

    }

Bolt

处理逻辑: 在接收到的每一个单词后面添加'!'.

 public static class ExclaimBolt extends BaseBasicBolt {

    @Override

    public void execute(Tuple tuple, BasicOutputCollector collector) {

      String input = tuple.getString(1);

      collector.emit(new Values(tuple.getValue(0), input + "!"));

    }

    @Override

    public void declareOutputFields(OutputFieldsDeclarer declarer) {

      declarer.declare(new Fields("id", "result"));

    }

  }

运行

java -cp $(lein classpath) storm.starter.BasicDRPCTopology

Apache Storm技术实战之2 -- BasicDRPCTopology的更多相关文章

Apache Storm技术实战之1 -- WordCountTopology
欢迎转载,转载请注意出处,徽沪一郎. “源码走读系列”从代码层面分析了storm的具体实现,接下来通过具体的实例来说明storm的使用.因为目前storm已经正式迁移到Apache,文章系列也由twi ...
Apache Storm技术实战之3 -- TridentWordCount
欢迎转载,转载请注明出处. 介绍TridentTopology的使用,重点分析newDRPCStream和stateQuery的实现机理. 使用TridentTopology进行数据处理的时候,经常会 ...
Apache Spark技术实战之6 --Standalone部署模式下的临时文件清理
问题导读 1.在Standalone部署模式下,Spark运行过程中会创建哪些临时性目录及文件? 2.在Standalone部署模式下分为几种模式? 3.在client模式和cluster模式下有什么 ...
Apache Spark技术实战之4 -- 利用Spark将json文件导入Cassandra
欢迎转载,转载请注明出处. 概要本文简要介绍如何使用spark-cassandra-connector将json文件导入到cassandra数据库,这是一个使用spark的综合性示例. 前提条件假 ...
Apache Spark技术实战之3 -- Spark Cassandra Connector的安装和使用
欢迎转载,转载请注明出处,徽沪一郎. 概要前提假设当前已经安装好如下软件 jdk sbt git scala 安装cassandra 以archlinux为例,使用如下指令来安装cassandra ...
Apache Spark技术实战之9 -- 日志级别修改
摘要在学习使用Spark的过程中,总是想对内部运行过程作深入的了解,其中DEBUG和TRACE级别的日志可以为我们提供详细和有用的信息,那么如何进行合理设置呢,不复杂但也绝不是将一个INFO换为TR ...
Apache Spark技术实战之8：Standalone部署模式下的临时文件清理
未经本人同意严禁转载,徽沪一郎. 概要在Standalone部署模式下,Spark运行过程中会创建哪些临时性目录及文件,这些临时目录和文件又是在什么时候被清理,本文将就这些问题做深入细致的解答. 从 ...
Apache Spark技术实战之7 -- CassandraRDD高并发数据读取实现剖析
未经本人同意,严禁转载,徽沪一郎. 概要本文就 spark-cassandra-connector 的一些实现细节进行探讨,主要集中于如何快速将大量的数据从cassandra 中读取到本地内存或磁盘 ...
Apache Spark技术实战之6 -- spark-submit常见问题及其解决
除本人同意外,严禁一切转载,徽沪一郎. 概要编写了独立运行的Spark Application之后,需要将其提交到Spark Cluster中运行,一般会采用spark-submit来进行应用的提交 ...

随机推荐

Ant基本使用指南
近期碰到了其他人在讨论这个ant,已经很多人在使用,故对他进行收集资料进了解,以便方便去使用.同时,在学习struts+spring+hibernate,尤其是Appfuse的过程中大量涉及到ant的 ...
PW试验-----verilog
PWM,脉冲宽度调制.顾名思义,是通过调制脉冲的宽度,即占空比,来实现的.可是使占空比逐渐由最小增加到最大,也可以使占空比由最大减少到最小来实现不同的现象.若用LED灯来显示现象,则可以称作:LED呼 ...
如何从Apache官网下载windows版apache服务器
参考文章:http://jingyan.baidu.com/article/29697b912f6539ab20de3cf8.html
jquery easy ui 1.3.4 Tree树形菜单（9）
9.1.创建树形菜单 <ul id="tt" class="easyui-tree"> <li><span>第一级</ ...
Java Hour 12 Generic
有句名言,叫做10000小时成为某一个领域的专家.姑且不辩论这句话是否正确,让我们到达10000小时的时候再回头来看吧. 本文作者Java 现经验约为12 Hour,请各位不吝赐教. 泛型程序设计为 ...
PL/SQL Developer 连接新数据库
1 2 3
ural 1018(树形dp)
题目链接:http://acm.hust.edu.cn/vjudge/problem/viewProblem.action?id=17662 思路:典型的树形dp,处理的时候类似于分组背包,dp[i] ...
html5 canvas 标签
<canvas id="board" width="500" height="400"></canvas> < ...
Tomcat中的webapps中的web应用的文件结构
可仿造Tomcat中的webapps下的已有web应用的例子具体文件结构如下:
误删除了mssql的表。使用命令：drop table xxxx
使用ApexSQL Recover工具进行恢复.教程如下: http://solutioncenter.apexsql.com/zh/%E6%B2%A1%E6%9C%89%E5%A4%87%E4%BB ...

Apache Storm技术实战之2 -- BasicDRPCTopology