本文源码:GitHub || GitEE 一.Flume简介 1.基础描述 Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集.聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据: 特点:分布式.高可用.基于流式架构,通常用来收集.聚合.搬运不同数据源的大量日志到数据仓库. 2.架构模型 Agent包括三个核心组成,Source.Channel.Sink.Source负责接收数据源,并兼容多种类型,Channel是数据的缓冲区,Sink处理数…