一.海量数据: 量:大.数目多,数据量到达PB.ZB级别,条目数到达几十亿条.百亿条 1)存储:分布式,集群的概念,管理(主节点.从节点),HDFS(HadoopDistributedFileSystem) 2)分析:分布式,并行,离线计算框架,管理(主节点.从节点),MapReduce ApacheHadoopLogo,一只会飞的大象 二.Hadoop与Google的关系 HDFS–>GFS开源文件系统 HadoopMapReduce:核心就是对数据的排序优化 GoogleMapReduce–…