Spark Streaming揭秘 Day32 Kafka原理内幕 今天开始,会有几天的时间,和大家研究下Kafka.在大数据处理体系中,kafka的重要性不亚于SparkStreaming.可以认为sparkstreaming掌控处理,而kafka掌控流程控制. 让我们来了解下sparkstreaming和kafka的整合细节. 三大特征 消息组件一般有两种类型: 队列方式,可能有一个循环器不断循环一个对象(消息队列),当消息A进入中队列中,被唤醒感知到队列时,交给处理者handler来处理.…