1.hadoop是什么? Hadoop 是Apache基金会下一个开源的大数据分布式计算平台,它以分布式文件系统HDFS和MapReduce算法为核心,为用户提供了系统底层细节透明的分布式基础架构. 2.hadoop主要组成部分 1)hdfs分布式存储文件系统---海量数据存储,大文件被分成默认64M一块的数据块分布存储在集群机器中 2)Yarn资源管理与作业调度 3)MapReduce算法---数据计算(并行计算框架) 3.hadoop特点 可靠.高效.可伸缩.容错.不适合低延迟数据访问.可处…