Gartner:如何选择正确的Hadoop版本 这份报告的全名是<How to Choose the Right Apache Hadoop Distribution>.主要介绍了企业如何引入Hadoop,其中一些内容很好,值得一看. 在文中Gartner分析了Hadoop的由来,并且指出,目前开源项目的方式为使用Apache Hadoop带来了挑战,因为其中的内容都是很多厂家贡献出来的,成熟度不一样,甚至一些中包含了很个性化的代码,这些代码可能只对某些厂家特殊的业务环境有效. 为此Gartn
HDFS存储系统 一.基本概念 1.NameNode HDFS采用Master/Slave架构.namenode就是HDFS的Master架构.主要负责HDFS文件系统的管理工作,具体包括:名称空间(namespace)管理(如打开.关闭.重命名文件和目录.映射关系).文件block管理.NameNode提供的是始终被动接收服务的server.一个文件被分成一个或多个Bolck,这些Block存储在DataNode集合里,NameNode就负责管理文件Block的所有元数据信息. Seconda