storm和kafka的wordCount

这个是在window环境下面安装的kafka

下载pom依赖

  <dependency>

      <groupId>org.apache.storm</groupId>

      <artifactId>storm-kafka-client</artifactId>

      <version>1.1.1</version>

    </dependency>

    <dependency>

      <groupId>org.apache.kafka</groupId>

      <artifactId>kafka-clients</artifactId>

      <version>0.10.0.0</version>

    </dependency>

    <dependency>

      <groupId>org.apache.storm</groupId>

      <artifactId>storm-core</artifactId>

      <version>1.1.1</version>

      <!--  本地测试注释集群运行打开 -->

      <!--  <scope>provided</scope>-->

    </dependency>

编写代码

编写SplitSentenceBolt

public class SplitSentenceBolt extends BaseRichBolt {

private OutputCollector collector;

	@Override

	public void prepare(Map map, TopologyContext topologyContext, OutputCollector outputCollector) {

		this.collector=outputCollector;

	}

	@Override

	public void execute(Tuple tuple) {

		//String sentece = tuple.getStringByField("sentence");

		String sentece=tuple.getString(4);

		String[] words = sentece.split(" ");

		for (String word:words){

			collector.emit(new Values(word));

		}

	}

	@Override

	public void declareOutputFields(OutputFieldsDeclarer outputFieldsDeclarer) {

		outputFieldsDeclarer.declare(new Fields("words"));

	}

}

编写WordCountBolt

public class WordCountBolt extends BaseRichBolt {

	private  OutputCollector collector;

	private HashMap<String,Long> counts =null;

	@Override

	public void prepare(Map map, TopologyContext topologyContext, OutputCollector outputCollector) {

		this.collector = outputCollector;

		this.counts = new HashMap<>();

	}

	@Override

	public void execute(Tuple tuple) {

		 String word = tuple.getStringByField("words");

		// String word =tuple.getString(0);

		Long count=this.counts.get(word);

		if(count==null){

			count=0L;

		}

		count++;

		//出现就添加到map中,word相同的,会覆盖掉 所以最后的word就是准确的数据

		this.counts.put(word,count);

		this.collector.emit(new Values(word,count));

	}

	@Override

	public void declareOutputFields(OutputFieldsDeclarer outputFieldsDeclarer) {

			outputFieldsDeclarer.declare(new Fields("word","count"));

	}

}

编写ReportBolt

public class ReportBolt extends BaseRichBolt {

private HashMap<String,Long> counts=null;

@Override

public void prepare(Map map, TopologyContext topologyContext, OutputCollector outputCollector) {

this.counts=new HashMap<String,Long>();

}

	@Override

	public void execute(Tuple input) {

		String word=input.getStringByField("word");

		Long count=input.getLongByField("count");

		this.counts.put(word, count);

		System.out.println("--------FINAL COUNTS--------");

		List<String> keys=new ArrayList<String>();

		keys.addAll(this.counts.keySet());

		Collections.sort(keys);

		for(String key:keys){

			System.out.println(key+":"+this.counts.get(key));

		}

		System.out.println("----------------------------");

	}

	@Override

	public void declareOutputFields(OutputFieldsDeclarer outputFieldsDeclarer) {

	}

}

编写Topology

public class MainTopology {

public static void main(String[] args)throws Exception {

TopologyBuilder builder = new TopologyBuilder();

KafkaSpoutConfig.Builder<String, String> kafkabuilder = KafkaSpoutConfig.builder("localhost:9092", "test");

		//设置kafka属于哪个组

		kafkabuilder.setGroupId("testgroup");

		//创建kafkaspoutConfig

		KafkaSpoutConfig<String, String> build = kafkabuilder.build();

		//通过kafkaspoutconfig获取kafkaspout

		KafkaSpout<String, String> kafkaSpout = new KafkaSpout<>(build);

		//设置四个线程接收数据

		builder.setSpout("kafkaspout",kafkaSpout,4);

//		builder.setBolt("printBolt", new PrintBolt(),2).localOrShuffleGrouping("kafkaspout");

		builder.setBolt("split-bolt",new SplitSentenceBolt(),2).setNumTasks(4).shuffleGrouping("kafkaspout");

		// 有时候我们需要将特定数据的tuple路由到特殊的bolt实例中,在此我们使用fieldsGrouping

		// 来保证所有"word"字段值相同的tuple会被路由到同一个WordCountBolt实例中

		builder.setBolt("count-bolt",new WordCountBolt(),2).fieldsGrouping("split-bolt",new Fields("words"));

		builder.setBolt("report-bolt",new ReportBolt()).globalGrouping("count-bolt");

		Config config=new Config();

		config.setDebug(false);

		config.setNumWorkers(2);

		LocalCluster cluster =new LocalCluster();

		cluster.submitTopology("kafkaspout",config,builder.createTopology());

	}

storm和kafka的wordCount的更多相关文章

Storm集成Kafka应用的开发
我们知道storm的作用主要是进行流式计算,对于源源不断的均匀数据流流入处理是非常有效的,而现实生活中大部分场景并不是均匀的数据流,而是时而多时而少的数据流入,这种情况下显然用批量处理是不合适的,如果 ...
storm集成kafka
kafkautil: import java.util.Properties; import kafka.javaapi.producer.Producer; import kafka.produce ...
storm消费kafka实现实时计算
大致架构 * 每个应用实例部署一个日志agent * agent实时将日志发送到kafka * storm实时计算日志 * storm计算结果保存到hbase storm消费kafka 创建实时计算项 ...
2018.5.12 storm数据源kafka堆积
问题现象: storm代码依赖4个源数据topic,2018.5.12上午8点左右开始收到告警短信,源头的4个topic数据严重堆积. 排查: 1.查看stormUI, storm拓扑结构如下: 看现 ...
storm集成kafka的应用，从kafka读取，写入kafka
storm集成kafka的应用,从kafka读取,写入kafka by 小闪电 0前言 storm的主要作用是进行流式的实时计算,对于一直产生的数据流处理是非常迅速的,然而大部分数据并不是均匀的数据流 ...
storm和kafka整合
storm和kafka整合依赖 <dependency> <groupId>org.apache.storm</groupId> <artifactId&g ...
Storm 学习之路（九）—— Storm集成Kafka
一.整合说明 Storm官方对Kafka的整合分为两个版本,官方说明文档分别如下: Storm Kafka Integration : 主要是针对0.8.x版本的Kafka提供整合支持: Storm ...
Storm 系列（九）—— Storm 集成 Kafka
一.整合说明 Storm 官方对 Kafka 的整合分为两个版本,官方说明文档分别如下: Storm Kafka Integration : 主要是针对 0.8.x 版本的 Kafka 提供整合支持: ...
Storm消费Kafka提交集群运行
1.创建拓扑,配置KafkaSpout.Bolt KafkaTopologyBasic.java: package org.mort.storm.kafka; import org.apache.ka ...

随机推荐

linux mysql 卸载，安装，測试全过程
Mysql卸载 yum remove mysql mysql-server mysql-libs compat-mysql51 rm -rf /var/lib/mysql rm /etc/my.cnf ...
Python 库的使用 —— dis
dis:Disassembler of Python byte code into mnemonics. Java.Python.Ruby 1.9 这些语言均使用了栈机器型的 VM.因为是基于栈的实现 ...
【a601】雇佣计划
Time Limit: 1 second Memory Limit: 32 MB [问题描述] 一位管理项目的经理想要确定每个月需要的工人,他知道每月所需的最少工人数.当他雇佣或解雇一个工人时,会有一 ...
小强的HTML5移动开发之路（15）——HTML5中的音频
浏览器虽然发展很快,但是浏览器中的标准还是不完善,在HTML4+CSS2+JS的前段开发中让很多程序员头疼的就是浏览器的兼容性问题,音频播放也一样,直到现在,仍然不存在一项网页上播放视频和音频的标准. ...
Acdreamoj1116（Gao the string!）弦hash+二分法+矩阵高速功率
Problem Description give you a string, please output the result of the following function mod 100000 ...
C#--动态操作DataTable
C#动态操作DataTable(新增行.列.查询行.列等) 方法一:动态创建一个DataTable ,并为其添加数据 public void CreateTable() { ...
继承之重写prototype
function Ff(){} //undefined Ff.prototype={a:"ss"} //Object {a: "ss"} var f1= new ...
解决关于archlinux升级至3.16.1，Xorg桌面环境无法进入的问题
[现象]有终端输入username,password后,桌面环境启动失败. [报错]log文件里显示: (EE) Fatal server error: (EE) xf86OpenConsole: V ...
联合概率（joint probability）、分布函数（distribution function）
0. PMF 与 PDF 的记号 PMF:PX(x) PDF:fX(x) 1. 联合概率联合概率:是指两个事件同时发生的概率. P(A,B)=P(B|A)⋅P(A)⇒P(B|A)=P(A,B)P(A ...
WPF 3D Transparency Depth-Order Sorting
原文:WPF 3D Transparency Depth-Order Sorting Just a quick post here - When making WPF 3D apps, trans ...

storm和kafka的wordCount

storm和kafka的wordCount的更多相关文章

随机推荐

热门专题