为什么要用集群? 企业里面,多台机器 伪分布式 每一个角色都是一个进程 HDFS: NN SNN DN YARN: RM NM 大数据所有组件, 都是主从架构 master-slave HDFS读写请求都是先到NN节点, 但是,HBase 读写请求不是经过master, 建表和删除表是需要经过master NN节点挂了,就不能提供对外服务 (-put,-get) 需要配置两个NN节点(实时的,任何时刻只有一台active对外, 另外一台是standby,做实时备份, 随时准备着从standby切…