简单理解为:Receiver方式是通过zookeeper来连接kafka队列,Direct方式是直接连接到kafka的节点上获取数据 一.Receiver方式: 使用kafka的高层次Consumer api来实现的,Receiver从kafka中获取的数据都是存储在spark executor的内存中,然后Spark Streaming启动的job会去处理那些数据.然而,在默认的配置下,这种方式可能会因为底层的失败而丢失数据.如果要启用高可用机制,让数据零丢失,就必须启用Spark Strea…