Kafka是什么 Kafka最初是由LinkedIn公司采用Scala语言开发的一个分布式.多分区.多副本且基于ZooKeeper协调的内部基础设置,现已捐献给Apache基金会.Kafka是一个流平台,主要用来发布和订阅数据流,是流式数据处理的利器.Kafka用于构建实时数据管道和流应用程序,具有水平可伸缩性,容错性,快速性.Kafka可以处理消费者的网站中的所有动作(网页浏览,搜索和其他用户的行动)流数据.这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决.对于像Hadoop的一样