定义 HDFS(Hadoop Distributed File System)是分布式文件管理系统中的一种,用来管理多台机器上的文件,通过目录树来定位文件. 由很多服务器联合起来实现其功能,集群中的服务器有各自的角色. 适合一次写入,多次读取,且不支持文件的修改.适合用来做数据分析,不适合用来做网盘应用. 优缺点 优点: 1.高容错性 数据自动保存多个副本.通过增加副本的形式,提高容错性某一个副本丢失以后,可以自动恢复 2.适合处理大数据. 3.可运行在廉价机器上,通过多副本机制,提高可靠性.…