本课程的基础课程是,Hadoop数据分析平台课程.相信,能看我本博文的朋友,是有一定的基础了. 只是前个课程是讲解,这个课程是应用. 第一层是:数据源层,代表有生产线上的数据,比如关系型数据库orcal,电子商务网站,网站的访问日志. 第二层是:数据仓库或数据集层. 第三层是:数据探索层,如要列出本月话费达到500元的用户等,理解为对数据的简单一些加工. 第四层是:数据挖掘层,主要是以知识挖掘为主. 数据探索层和数据挖掘层的区别: 比如,数据挖掘层,不是求什么平均多少,指标,而是隐藏的规律和知识…