1.Spark Streaming是什么 Spark Streaming是在Spark上建立的可扩展的高吞吐量实时处理流数据的框架,数据可以是来自多种不同的源,例如kafka,Flume,Twitter,ZeroMQ或者TCP Socket等.在这个框架下,支持对流数据的各种运算,比如map,reduce,join等.处理过后的数据可以存储到文件系统或数据库. 利用Spark Streaming,你可以使用与批量加载数据相同的API来创建数据管道,并通过数据管道处理流式数据.此外,Spark S