在最近的一些项目中,我使用Apache Kafka开发了一些数据管道.在性能测试方面,数据生成总是会在整个活动中引入一些样板代码,例如创建客户端实例,编写控制流以发送数据,根据业务逻辑随机化有效负载等等. 在测试设置期间,拥有一个处理所有繁重工作的框架会很好,因此只需要回答两个基本和基本的问题: 数据应该是什么样的?(架构) 要生成多少数据?(体积) 有了Kafka Connect,事实证明实现自定义源连接器能够实现这一目标.以下是用于生成测试数据的示例属性列表的快速概述. topic.name…