一.Hadoop介绍 Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS.HDFS有高容错性的特点,并且设计用来部署在低廉的硬件上:而且它提供高吞吐量来访问应用程序的数据,适合那些有着超大数据集的应用程序.Hadoop的框架最核心的设计就是:HDFS和MapReduce,HDFS为海量的数据提供了存储,MapReduce为海量的数据提供了计算. 二.安装Hadoop 环境:Docker(17.04.0-ce).镜像Ubuntu(16…