大数据技术栈在当下已经是比较成熟的了,Hadoop 作为大数据存储的基石,其重要程度不言而喻,作为一个想从 java 后端转向大数据开发的程序员来说,打好 Hadoop 基础,就相当于夯实建造房屋的地基,本文以上图结构为基本,旨在帮助大家快速了解 Hadoop 运行机制. HDFS 篇 HDFS就是大家熟知的分布式存储的文件系统,它包括 3 个组件,结构如下图: NameNode 相当于 Master 节点,它是管理者: DataNode 是 Slave,是执行实际操作的节点: Secondry