关键节点的单点故障(Single Point of Failure)在大型的架构中,往往是致命的。比如:SOA架构中,服务注册中心(Server Register)统一调度所有服务,如果这个节点挂了,基本上整个SOA架构也就崩溃了,另外hadoop 1.x/2.x中的namenode节点,这是hdfs的核心节点,如果namenode宕掉,hdfs也就废了。ZooKeeper的出现,很好的解决了这一难题,其核心原理如下:

1. 关键节点的运行实例(或服务器),可以跑多个,这些实例中的数据完全是相同的(即:对等设计),每个实例启动后,向ZK注册一个临时顺序节点,比如 /core-servers/server0000001, /core-servers/server0000002 ... ,最后的顺序号是由ZK自动递增的

2. 其它应用需要访问1中的核心服务器里,可以事先约定好,从ZK的这些临时节点中,挑选一个序号最小的节点,做为主服务器(即master)

3. 当master宕掉时,超过一定的时间阈值,临时节点将由ZK自动删除,这样原来序列最小的节点也就没了,客户端应用按2中的约定找最小节点的服务器时,自动会找到原来次最小的节点,继续充为master(老大挂了,老二顶上),即实现了故障转换。如果原来出问题的master恢复了,重新加入ZK,由于顺序号是一直递增,重新加入后,它将做为备胎待命。

示例代码如下:

上面是类图,CoreServer类对应核心服务器,ClientServer类对应客户端应用服务器,SPOFTest为单元测试类

CoreServer代码:

package yjmyzz.test;

import org.I0Itec.zkclient.ZkClient;

public class CoreServer {

    private String hostName;

    public CoreServer(String hostName) {
this.hostName = hostName;
} public void start() {
ZkClient zk = ZKUtil.getZkClient();
if (!zk.exists(ZKUtil.CORE_SERVER_NODE_NAME)){
zk.createPersistent(ZKUtil.CORE_SERVER_NODE_NAME);
}
zk.createEphemeralSequential(ZKUtil.CORE_SERVER_NODE_NAME + "/server", hostName);
System.out.println(hostName + " is running..."); } public String getHostName() {
return hostName;
} }

ClientServer类:

package yjmyzz.test;

import org.I0Itec.zkclient.ZkClient;

import java.util.Arrays;
import java.util.List; /**
* Created by jimmy on 15/6/28.
*/
public class ClientServer { private String getCoreServer() {
ZkClient zk = ZKUtil.getZkClient();
List<String> servers = ZKUtil.getZkClient().getChildren(ZKUtil.CORE_SERVER_NODE_NAME);
if (servers.size() <= 0) {
return null;
}
for (String s : servers) {
System.out.println(s);
}
Object[] arr = servers.toArray();
Arrays.sort(arr); String data = zk.readData(ZKUtil.CORE_SERVER_NODE_NAME + "/" + arr[0].toString());
System.out.println("node:" + arr[0].toString() + ", data:" + data);
return data;
} public void run(){
System.out.println("客户端应用运行中,正在调用:" + getCoreServer() + " 上的服务");
}
}

SPOF测试类:

package yjmyzz.test;

import org.junit.Test;

import java.util.concurrent.TimeUnit;

/**
* Created by jimmy on 15/6/28.
*/
public class SPOFTest { @Test
public void startCoreServer1() throws InterruptedException { CoreServer server1 = new CoreServer("server1");
server1.start(); while (true) {
TimeUnit.SECONDS.sleep(5);
} } @Test
public void startCoreServer2() throws InterruptedException { CoreServer server2 = new CoreServer("server2");
server2.start(); while (true) {
TimeUnit.SECONDS.sleep(5);
} } @Test
public void testSPOF() throws InterruptedException {
ClientServer clientServer = new ClientServer();
clientServer.run(); //此时,手动停止coreServer1
TimeUnit.SECONDS.sleep(60); //再次运行
clientServer.run(); } }

测试步骤:

1. 先启用startCoreServer1()、startCoreServer2() 由于这二个方法中,最后用死循环阻止了程序退出,所以这二台server会一直运行下去,除非手动kill 进程

2. 再启用testSPOF(),在45行这里可以打个断点,进入断点时,可以手动把startCoreServer1()对应的进程kill掉,即:模拟server1挂掉,然后继续执行,观察输出。

运行结果:

zookeeper state changed (SyncConnected)
server0000000007
server0000000006
node:server0000000006, data:server1
客户端应用运行中,正在调用:server1 上的服务
...
zookeeper state changed (SyncConnected)
server0000000007
Disconnected from the target VM, address: '127.0.0.1:64788', transport: 'socket'
node:server0000000007, data:server2
客户端应用运行中,正在调用:server2 上的服务

-------------

从测试结果看,客户端访问的核心服务器,自动从server1切换到了server2上。

  

ZooKeeper 笔记(4) 实战应用之【消除单点故障】的更多相关文章

  1. ZooKeeper 笔记(3) 实战应用之【统一配置管理】

    大型应用通常会按业务拆分成一个个业务子系统,这些大大小小的子应用,往往会使用一些公用的资源,比如:需要文件上传.下载时,各子应用都会访问公用的Ftp服务器.如果把Ftp Server的连接IP.端口号 ...

  2. AngularJS in Action读书笔记6(实战篇)——bug hunting

    这一系列文章感觉写的不好,思维跨度很大,原本是由于与<Angularjs in action>有种相见恨晚而激发要写点读后感之类的文章,但是在翻译或是阐述的时候还是会心有余而力不足,零零总 ...

  3. (转)ZooKeeper 笔记(1) 安装部署及hello world

    ZooKeeper 笔记(1) 安装部署及hello world   先给一堆学习文档,方便以后查看 官网文档地址大全: OverView(概述) http://zookeeper.apache.or ...

  4. Zookeeper C++编程实战之配置更新

    CZookeeperHelper:https://github.com/eyjian/libmooon/blob/master/include/mooon/net/zookeeper_helper.h ...

  5. Zookeeper笔记之命令行操作

    $ZOOKEEPER_HOME/bin下的zkCli.sh进入命令行界面,使用help可查看支持的所有命令: 一.节点相关操作 create [-s] [-e] path data acl creat ...

  6. Hadoop学习笔记(8) ——实战 做个倒排索引

    Hadoop学习笔记(8) ——实战 做个倒排索引 倒排索引是文档检索系统中最常用数据结构.根据单词反过来查在文档中出现的频率,而不是根据文档来,所以称倒排索引(Inverted Index).结构如 ...

  7. Zookeeper原理和实战开发经典视频教程 百度云网盘下载

    Zookeeper原理和实战开发 经典视频教程 百度云网盘下载 资源下载地址:http://pan.baidu.com/s/1o7ZjPeM   密码:r5yf   

  8. 笔记-unittest实战

    笔记-unittest实战 1.      框架图 2.      用例 编写自己的测试用例类,继承于基类 class ApiTestCase(unittest.TestCase): setUp方法会 ...

  9. 《Netty Redis Zookeeper 高并发实战》 勘误

    <Netty Redis Zookeeper 高并发实战> 勘误与申明 疯狂创客圈 Java 高并发[ 亿级流量聊天室实战]实战系列 [博客园总入口 ] 勘误一 文字问题: Page1 J ...

随机推荐

  1. Github上十大C#开源项目排行榜

    1.SignalR ASP.NET SignalR 是为 ASP.NET 开发人员提供的一个库,可以简化开发人员将实时 Web 功能添加到应用程序的过程.当WebSockets可用时(即浏览器支持Ht ...

  2. (视频)《快速创建网站》 4.2 完结篇 – 应用运营vs.发射卫星,遥测(Telemetry) 技术

    本文是<快速创建网站>系列的第10篇(完结篇),如果你还没有看过之前的内容,建议你点击以下目录中的章节先阅读其他内容再回到本文.访问本系列目录,请点击:http://devopshub.c ...

  3. VS发布,应用程序验证未成功。无法继续。

    用VS2005发布客户端程序. 1.发布:点击工程项目属性,右键发布按钮,一切正常. 2.测试安装:提示如下提示框: 打开详细信息内容如下: 错误摘要 以下是错误摘要,这些错误的详细信息列在该日志的后 ...

  4. [Linux监控]磁盘空间大小

    echo 192.168.10.69>>ip.list ------------------------------------------- #!/bin/bash #注意if和[]之间 ...

  5. 使用.Net自带的GZipStream进行流压缩与解压

    using System.IO; using System.IO.Compression; using System.Text; namespace CS.Utility { /// <summ ...

  6. oops call trace 解析

    Call Trace: [  221.634988]  [<ffffffff8103fbc7>] ? kmld_pte_lookup+0x17/0x60 [  221.635016]  [ ...

  7. 【JAVA小结】类的属性组的使用

    public class UsingAttribute { static String strA = "string-a"; static String strB; static ...

  8. 入门 ARM 汇编(二)—— 寻址方式

    忧愁他整天拉着我的心,像一个琴师操练他的琴:悲哀像是海礁间的飞涛:看他那汹涌,听他那呼号!—— 徐志摩·四行诗一首 ilocker:关注 Android 安全(新手) QQ: 2597294287 立 ...

  9. Spring AOP 开发中遇到问题:Caused by: java.lang.IllegalArgumentException: warning no match for this type name: com.xxx.collector.service.impl.XxxServiceImpl [Xlint:invalidAbsoluteTypeName]

    在网上找了很多,都不是我想要的,后来发现是我在springaop注解的时候 写错了类名导致的这个问题 @Pointcut("execution(* com.xxx.collector.ser ...

  10. 关于AngularJs中的路由学习总结

    AngularJs中的路由,应用比较广泛,主要是允许我们通过不同的url访问不同的内容,可实现多视图的单页web应用.下面看看具体怎么使用. 关于路由  通常我们的URL形式为http://jtjds ...