上一张初识里面谢了一些flume入门的内容,其实在真正工作环境里面这种情况使用的是很少的,大部分情况,我们可能需要从多台设备的日志里面汇总收集数据并存储到HDFS上,以便于后期对数据进行处理,真实的情况可能是这样的,分别根据不同的消息来源进行不同的处理,不同的存储.. 上面只是一个大致情况,一般情况下,我们会将Flume里面可以做的还有很多,大批量的日志数据我们不能说都不加以处理就直接推送出去,一般的,我们会在数据源头对数据进行过滤(即对source进行属性配置),目前来说采用日志数据过滤的方式…