1 预备知识--Hadoop简介 Hadoop是Apache的一个开源的分布式计算平台,以HDFS分布式文件系统和MapReduce分布式计算框架为核心,为用户提供了一套底层透明的分布式基础设施Hadoop框架中最核心设计就是:HDFS和MapReduce. HDFS提供了海量数据的存储,MapReduce提供了对数据的计算.Hadoop框架中最核心的设计就是: HDFS 和MapReduce--HDFS是Hadoop分布式文件系统,具有高容错性.高伸缩性,允许用户基于廉价硬件部署,构建分布式存…