一个topic有多个partition,每个partition又有多个副本,在这些副本中又有一个leader和多个follower. 1)分区的原因 (1)方便在集群中扩展,每个Partition可以通过调整以适应它所在的机器,而一个topic又可以有多个Partition组成,因此整个集群就可以适应任意大小的数据了: (2)可以提高并发,因为可以以Partition为单位读写了. 2)分区的原则 我们需要将producer发送的数据封装成一个ProducerRecord对象. (1)指明 pa