原来:计算效率低 现在:成本降低,能用PC机,就不用大型机和高端存储了:软件容错硬件故障视为常态,通过软件保证可靠性:简化并行分布式计算,无需控制节点同步和数据交换,但是谷歌只发表了相关技术论文,没有开源实现,hadoop是模仿谷歌大数据技术的开源实现来了. 谷歌大数据技术:MapReduce.BigTable.GFS 目前hadoop是属于apache,他是开源的,分布式存储和分布式计算的平台. 核心组成: HDFS,分布式文件系统,存储海量数据: MapReduce,并行处理框架,实现任务分…