使用QJM实现HDFS的HA配置 1.背景 hadoop 2.0.0之前,namenode存在单点故障问题(SPOF,single point of failure),如果主机或进程不可用时,整个集群就变得不可用,直到namenode进行重启或产生新的namenode.主要有两种方式会影响到HDFS集群: 不可预期事件比如机器宕机,集群变得不可用直到操作人员重启namenode. 可预期事件比如软硬件升级也会导致集群的下线. HDFS的高可用特性解决了以上两个问题,通过在一个集群中运行两个冗余的…