介绍 传统数据库对数据处理一般都分成两类:OLTP和OLAP. 数据分析(OLAP)的前提条件是要准备数据. 然后才是具体的数据分析,对此,可以分为统计型的数据分析和挖掘性的数据分析. 最后对分析结果的后续处理,比较常见的有数据可视化展示等. 总之,面对具体问题,首先要搞清楚数据从哪儿来,到哪儿去的问题. 对于具体的处理方法和处理工具,今后会具体谈体聊. 数据前期处理 主要包括数据清洗,ETL转换,数据导入,数据采集等等方面工作. 数据分析 可以直接基于MapReduce处理,也可以是上封装的S…