Hdfs数据备份 一.概述 本文的hdfs数据备份是在两个集群之间进行的,如果使用snapshot在同一个集群上做备份,如果datanode损坏或误操作清空了数据,这样的备份就无法完全保证数据安全性.所以选择将hdfs里面的数据备份到另外的地方进行存储,选择hadoop的分布式复制工具distcp.将集群的数据备份到一个制作备份使用的集群,不要怕浪费资源,因为只是做备份使用,所以配置不要求太高,并且可以只是用一个节点接收数据.平常的话此服务器可以跑其他的任务,只有在备份的时间周期内才会有备份任务…