业务现状分析 WebServer/ApplicationServer分散在各个机器上,想在大数据平台hadoop上进行统计分析,就需要先把日志收集到hadoop平台上. 思考:如何解决我们的数据从其他的server上移动到Hadoop之上? 脚本shell,用cp拷贝到hadoop集群上,再通过hadoop fs -put xxxx存储到hdfs上,但是这种方式会有如下问题: 如何做监控?如果拷贝过程中某台机器断掉了怎么做到很好的监控? 采用cp方式,需要设定一个复制的间隔时间,这样做时效性如何…