流式(streaming)和批量( batch):流式数据,实际上更准确的说法应该是unbounded data(processing),也就是无边界的连续的数据的处理:对应的批量计算,更准确的说法是bounded data(processing),亦即有明确边界的数据的处理. 近年来流式计算框架编程接口的标准化,傻瓜化,SQL化日渐有走上台面的趋势.各家计算框架都开始认真考虑相关的问题,俨然成为大家竞争的热点方向. Dataflow模型:是谷歌在处理无边界数据的实践中,总结的一套SDK级别的解…