企业架构 数据源 webserver RDBMS 数据的采集 shell.flume.sqoop job 监控和调度 hue.oozie 数据清洗及分析 mapreduce.hive 数据保存 sqoop 概念: 三大功能 collecting(收集),aggregating(聚合),moving(传输) Flume是一个分布式的,可靠的,可用的,健壮且高容错性的框架,非常有效率的对大数据量 的日志数据进行收集,聚集,传输信息的服务,但老版本仅仅运行在Linux环境中 特点: on stream…