ZooKeeper客户端事件串行化处理
为了提升系统的性能,进一步提高系统的吞吐能力,最近公司很多系统都在进行异步化改造。在异步化改造的过程中,肯定会比以前碰到更多的多线程问题,上周就碰到ZooKeeper客户端异步化过程中的一个死锁问题,这里说明下。
通常ZooKeeper对于同一个API,提供了同步和异步两种调用方式。
同步接口很容易理解,使用方法如下:
1
2
|
ZooKeeper zk = new ZooKeeper(...); List children = zk.getChildren( path, true ); |
异步接口就相对复杂一点,使用方法如下:
1
2
3
4
5
6
7
|
ZooKeeper zk = new ZooKeeper(...); zk.getChildren( path, true , new AsyncCallback.Children2Callback() { @Override public void processResult( int rc, String path, Object ctx, List children, Stat stat ) { System.out.println( "Recive the response."
} }, null ); |
我们可以看到,异步调用中,需要注册一个Children2Callback,并实现回调方法:processResult。
上周碰到这样的问题:应用注册了对某znode子节点列表变化的监听,逻辑是在接受到ZooKeeper服务器节点列表变更通知(EventType.NodeChildrenChanged)的时候,会重新获取一次子节点列表。之前,他们是使用同步接口,整个应用可以正常运行,但是这次异步化改造后,出现了诡异现象,能够收到子节点的变更通知,但是无法重新获取子节点列表了。
下面,我首先把应用之前使用同步接口的逻辑代码,用一个简单的demo来演示下,如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
|
package
import
import
import
import
import
import
import
import
import
import
import
/** * ZooKeeper API 获取子节点列表,使用同步(sync)接口。 * @author <a href="mailto:nileader@gmail.com">银时</a> */ public ZooKeeper_GetChildren_API_Sync_Usage implements Watcher { private CountDownLatch connectedSemaphore = new CountDownLatch( 1 ); private static CountDownLatch _semaphore = new CountDownLatch( 1 ); private ZooKeeper zk; ZooKeeper createSession( String connectString, int sessionTimeout, Watcher watcher ) throws IOException { ZooKeeper zookeeper = new ZooKeeper( connectString, sessionTimeout, watcher ); try { connectedSemaphore.await(); } catch ( InterruptedException e ) { } return zookeeper; } /** create path by sync */ void createPath_sync( String path, String data, CreateMode createMode ) throws IOException, KeeperException, InterruptedException { if ( zk == null
zk = this .createSession( "domain1.book.zookeeper:2181" , 5000 , this ); } zk.create( path, data.getBytes(), Ids.OPEN_ACL_UNSAFE, createMode ); } /** Get children znodes of path and set watches */ List getChildren( String path ) throws KeeperException, InterruptedException, IOException{ System.out.println( "===Start to get children znodes.==="
if ( zk == null
zk = this .createSession( "domain1.book.zookeeper:2181" , 5000 , this ); } return zk.getChildren( path, true ); } public static void
throws
ZooKeeper_GetChildren_API_Sync_Usage sample = new ZooKeeper_GetChildren_API_Sync_Usage(); String path = "/get_children_test" ; try { sample.createPath_sync( path, "" , CreateMode.PERSISTENT ); sample.createPath_sync( path + "/c1" , "" , CreateMode.PERSISTENT ); List childrenList = sample.getChildren( path ); System.out.println( childrenList ); //Add a new child znode to test watches event notify. sample.createPath_sync( path + "/c2" , "" , CreateMode.PERSISTENT ); _semaphore.await(); } catch ( KeeperException e ) { System.err.println( "error: " + e.getMessage() ); e.printStackTrace(); } } /** * Process when receive watched event */ @Override public void process( WatchedEvent event ) { System.out.println( "Receive watched event:"
if ( KeeperState.SyncConnected == event.getState() ) { if ( EventType.None == event.getType() && null == event.getPath() ){ connectedSemaphore.countDown(); } else if ( event.getType() == EventType.NodeChildrenChanged ){ //children list changed try { System.out.println( this .getChildren( event.getPath() ) ); _semaphore.countDown(); } catch ( Exception e ) {} } } } } |
输出结果如下:
1
2
3
4
5
6
|
Receive watched event:WatchedEvent state:SyncConnected type :None path:null ===Start to get children znodes.=== [c1] Receive watched event:WatchedEvent state:SyncConnected type :NodeChildrenChanged path: /get_children_test ===Start to get children znodes.=== [c1, c2] |
在上面这个程序中,我们首先创建了一个父节点: /get_children_test,以及一个子节点:/get_children_test/c1。然后调用getChildren的同步接口来获取/get_children_test节点下的所有子节点,调用的同时注册一个watches。之后,我们继续向/get_children_test节点创建子节点:/get_children_test/c2,这个时候,因为我们之前我们注册了一个watches,因此,一旦此时有子节点被创建,ZooKeeper
Server就会向客户端发出“子节点变更”的通知,于是,客户端可以再次调用getChildren方法来获取新的子节点列表。
这个例子当然是能够正常运行的。现在,我们进行异步化改造,如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
|
package
import
import
import
import
import
import
import
import
import
import
import
import
import
/** * ZooKeeper API 获取子节点列表,使用异步(ASync)接口。 * @author <a href="mailto:nileader@gmail.com">银时</a> */ public ZooKeeper_GetChildren_API_ASync_Usage_Deadlock implements Watcher { private CountDownLatch connectedSemaphore = new CountDownLatch( 1 ); private static CountDownLatch _semaphore = new CountDownLatch( 1 ); private ZooKeeper zk; ZooKeeper createSession( String connectString, int sessionTimeout, Watcher watcher ) throws IOException { ZooKeeper zookeeper = new ZooKeeper( connectString, sessionTimeout, watcher ); try { connectedSemaphore.await(); } catch ( InterruptedException e ) { } return zookeeper; } /** create path by sync */ void createPath_sync( String path, String data, CreateMode createMode ) throws IOException, KeeperException, InterruptedException { if ( zk == null
zk = this .createSession( "domain1.book.zookeeper:2181" , 5000 , this ); } zk.create( path, data.getBytes(), Ids.OPEN_ACL_UNSAFE, createMode ); } /** Get children znodes of path and set watches */ void getChildren( String path ) throws KeeperException, InterruptedException, IOException{ System.out.println( "===Start to get children znodes.==="
if ( zk == null
zk = this .createSession( "domain1.book.zookeeper:2181" , 5000 , this ); } final CountDownLatch _semaphore_get_children = new CountDownLatch( 1 ); zk.getChildren( path, true , new AsyncCallback.Children2Callback() { @Override public void processResult( int rc, String path, Object ctx, List children, Stat stat ) { System.out.println( "Get Children znode result: [response code: " + rc + ", param path: " + path + ", ctx: " + ctx + ", children list: " + children + ", stat: " + stat ); _semaphore_get_children.countDown(); } }, null ); _semaphore_get_children.await(); } public static void
throws
ZooKeeper_GetChildren_API_ASync_Usage_Deadlock sample = new ZooKeeper_GetChildren_API_ASync_Usage_Deadlock(); String path = "/get_children_test" ; try { sample.createPath_sync( path, "" , CreateMode.PERSISTENT ); sample.createPath_sync( path + "/c1" , "" , CreateMode.PERSISTENT ); //Get children and register watches. sample.getChildren( path ); //Add a new child znode to test watches event notify. sample.createPath_sync( path + "/c2" , "" , CreateMode.PERSISTENT ); _semaphore.await(); } catch ( KeeperException e ) { System.err.println( "error: " + e.getMessage() ); e.printStackTrace(); } } /** * Process when receive watched event */ @Override public void process( WatchedEvent event ) { System.out.println( "Receive watched event:"
if ( KeeperState.SyncConnected == event.getState() ) { if ( EventType.None == event.getType() && null == event.getPath() ){ connectedSemaphore.countDown(); } else if ( event.getType() == EventType.NodeChildrenChanged ){ //children list changed try { this .getChildren( event.getPath() ); _semaphore.countDown(); } catch ( Exception e ) { e.printStackTrace(); } } } } } |
输出结果如下:
1
2
3
4
5
|
Receive watched event:WatchedEvent state:SyncConnected type :None path:null ===Start to get children znodes.=== Get Children znode result: [response code: 0, param path: /get_children_test , ctx: null, children list: [c1], stat: 555,555,1373931727380,1373931727380,0,1,0,0,0,1,556 Receive watched event:WatchedEvent state:SyncConnected type :NodeChildrenChanged path: /get_children_test ===Start to get children znodes.=== |
在上面这个demo中,执行逻辑和之前的同步版本基本一致,唯一有区别的地方在于获取子节点列表的过程异步化了。这样一改造,问题就出来了,整个程序在进行第二次获取节点列表的时候,卡住了。和应用方确认了,之前同步版本从来没有出现过这个现象的,所以开始排查这个异步化中哪里会阻塞。
这里,我们重点讲解在ZooKeeper客户端中,需要处理来自服务端的两类事件通知:一类是Watches时间通知,另一类则是异步接口调用的响应。值得一提的是,在ZooKeeper的客户端线程模型中,这两个事件由同一个线程处理,并且是串行处理。具体可以自己查看事件处理的核心类:org.apache.zookeeper.ClientCnxn.EventThread。
ZooKeeper客户端事件串行化处理的更多相关文章
- 【性能诊断】四、单功能场景的性能分析(RedGate,找到同一个客户端的并发请求被串行化问题)
问题描述: 客户端js连续发起两个异步http请求,请求地址相同,但参数不同:POST http://*.*.*.*/*****/webservice/RESTFulWebService/RESTFu ...
- 【原创】uwsgi中多进程+多线程原因以及串行化accept() - thunder_lock说明
如有不对,请详细指正. 最近再研究uwsgi如何部署python app,看uwsgi的文档,里面有太多的参数,但每个参数的解释太苍白,作为菜鸟的我实在是不懂.想搞清楚uwsgi的工作原因以及里面的一 ...
- MFC【6】文件I/O和串行化
文件输入和输出(I/O)服务是所有操作系统的主要工作.Microsoft Windows提供了各种API函数用来读.写和操作磁盘文件.MFC将这些桉树和CFile类融合在面对对象的模型里.其中CFil ...
- 【Java EE 学习 72 下】【数据采集系统第四天】【移动/复制页分析】【使用串行化技术实现深度复制】
一.移动.复制页的逻辑实现 移动.复制页的功能是在设计调查页面的时候需要实现的功能.规则是如果在同一个调查中的话就是移动,如果是在不同调查中的就是复制. 无论是移动还是复制,都需要注意一个问题,那就是 ...
- PHP面向对象04_串行化
oop04复习 2014-9-3 10:48:45 要点: --1.克隆对象 --2.__toString( ) --3. __call( ) --4.自动加载类 --5.对象串行化 1.克隆对象以及 ...
- 【PHP面向对象(OOP)编程入门教程】22.把对象串行化serialize()方法,__sleep()方法,__wakeup()方法
有时候需要把一个对象在网络上传输,为了方便传输,可以把整个对象转化为二进制串,等到达另一端时,再还原为原来的对象,这个过程称之为串行化(也叫序列化), 就像我们现在想把一辆汽车通过轮船运到美国去,因为 ...
- VC++ chap13 文档与串行化
Lesson 13 文档与串行化 13.1使用CArchive类对文件进行读写操作 //让对象数据持久性的过程称之为串行化,或者序列化 void CGraphicView::OnFileWrite() ...
- Java 对象的串行化(Serialization)
1.什么是串行化 对象的寿命通常随着生成该对象的程序的终止而终止.有时候,可能需要将对象的状态保存下来,在需要时再将对象恢复.我们把对象的这种能记录自己的状态以便将来再生的能力.叫作对象的持续性(pe ...
- Oracle 6 - 锁和闩 - transaction的可串行化
本文主要内容 1.transaction的可串行化 2.数据库并发带来的问题, dirty read, Nonrepeatable reads, Phantoms幻读 3.隔离级别和2中的问题 4. ...
随机推荐
- EBS HRMS数据表
4.1. 人员基本息 表 (PER_ALL_PEOPLE_F) ...
- Ubuntu下安装GTK环境
要生成C图形界面的程序,得安装GTK环境 安装GTK环境只要安装一个gnome-core-devel就可以了,里面集成了很多其他的包.除此之外还要转一些其他的 东西,如libglib2.0 ...
- VS2010 express中改变VC Default include/lib/… 目录
转自: Liz's Blog http://www.cnblogs.com/lizmy/archive/2012/01/10/2318258.html 2010中是以工程为单位,更改VC++ dire ...
- UNIX网络编程——通用套接字选项
1. SO_BROADCAST 套接字选项 本选项开启或禁止进程发送广播消息的能力.只有数据报套接字支持广播,并且还必须是在支持广播消息的网络上(例如以太网,令牌环网等).我们不可能在点对点链路上进行 ...
- 【Android应用开发】 推送原理解析 极光推送使用详解 (零基础精通推送)
作者 : octopus_truth 转载请注明出处 : http://blog.csdn.net/shulianghan/article/details/45046283 推送技术产生场景 : -- ...
- 概率论:假设检验-t检验和Augmented Dickey–Fuller test
http://blog.csdn.net/pipisorry/article/details/51184556 T检验 T检验,亦称student t检验(Student's t test),学生t检 ...
- linux目录间的瞬间转移:dtags
http://blog.csdn.net/pipisorry/article/details/50923957 linux下dtags的安装 apt-get install python3-pip # ...
- [Android游戏开发学习笔记]View和SurfaceView
本文为阅读http://blog.csdn.net/xiaominghimi/article/details/6089594的笔记. 在Android游戏中充当主要角色的,除了控制类就是显示类.而在A ...
- 【unix网络编程第三版】阅读笔记(二):套接字编程简介
unp第二章主要将了TCP和UDP的简介,这些在<TCP/IP详解>和<计算机网络>等书中有很多细致的讲解,可以参考本人的这篇博客[计算机网络 第五版]阅读笔记之五:运输层,这 ...
- printf函数压栈解惑
最近看到一些程序员的笔试题目,经常会考到printf函数的参数压栈问题,总体来讲就是参数从右向左依次压栈,再出栈,但是今天看到一个看似很简单的题目,却一直找不到头绪.题目如下: #include &l ...