Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集.聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据:同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力. Flume主要由3个重要的组件构成: Source:完成对日志数据的收集,分成transtion 和 event 打入到channel之中. Channel:主要提供一个队列的功能,对source提供中的数据进行简单的缓存. Sink:取出Channel中的数据…