StreamSets是一个大数据采集工具,数据源支持包括结构化和半/非结构化,目标源支持HDFS,HBase,Hive,Kudu,Cloudera Search, ElasticSearch等.它包括一个拖拽式的可视化数据流程设计界面,定时任务调度等功能.举例,它可以将数据源从Kafka+Spark Streaming连接到你的Hadoop集群,而不需要写一行代码. StreamSets并没有集成在cdh中,因此需要我们自己去官方下载软件包 下载地址: https://archives.stre…