HDFS设计目标 1)硬件错误是常态,数据保存需要冗余. 2)数据批量读取,Hadoop擅长数据分析而不是事务处理. 3)大规模数据集. 4)简单一致醒模型,降低系统复杂度,文件一次写入多次读取, 5)“数据就近”原则分配数据节点. HDFS体系结构 NameNode DataNode SecondayNameNode 事务日志 映像文件 NameNode 文件系统命名空间 记录每个文件系统数据块在各个DataNode上的位置和副本信息. 协调Client对文件的访问 记录命名空间内的改动 Na…