为什么要做数据治理? 业务繁多,数据繁多,业务数据不断迭代.人员流动,文档不全,逻辑不清楚,对于数据很难直观理解,后期很难维护. 在大数据研发中,原始数据就有着非常多的数据库,数据表. 而经过数据的聚合以后,又会有很多的维度表.如果想要对这些数据做好管理,光用文字.文档等东西是不够的,必须用图. Atlas就是把元数据变成图的工具. http://atlas.apache.org/ Atlas是一组可扩展和可扩展的核心基础治理服务,使企业能够有效地满足Hadoop中的合规性要求,并允许与整个企业