1. 简介 流式计算的历史 早在7.8年前诸如UC伯克利.斯坦福等大学就开始了对流式数据处理的研究,但是由于更多的关注于金融行业的业务场景或者互联网流量监控的业务场景,以及当时互联网数据场景的限制,造成了研究多是基于对传统数据库处理的流式化,对流式框架本身的研究偏少.目前这样的研究逐渐没有了声音,工业界更多的精力转向了实时数据库. 2010年Yahoo!对S4的开源,2011年twitter对Storm的开源,改变了这个情况.以前互联网的开发人员在做一个实时应用的时候,除了要关注应用逻辑计算处理…