1.什么是Flume:apache顶级项目,主要用来做数据采集.分布式.高可用,将海量日志进行采集.聚合.传输的系统.能够对数据进行简单处理在发送到接收方. 2.Flume组件:source.channel.sink,一个Flume可以有一个source,多个channel.多个sink (1)source:数据收集组件,将日志从不同的client中收集过来. (2)channel:数据缓冲区.临时存储从source传过来的Event. (3)sink:将event从channel中读取出来并移…