[原文地址] 日志聚集是YARN提供的日志中央化管理功能,它能将运行完成的Container/任务日志上传到HDFS上,从而减轻NodeManager负载,且提供一个中央化存储和分析机制.默认情况下,Container/任务日志存在在各个NodeManager上,如果启用日志聚集功能需要额外的配置. 这个日志存储的就是具体map和reduce的日志,包括框架的和应用程序里自己打印的.这个日志聚合是用来看日志的,而mapreduce job history server,则是用来看某个applic…