在python中使用zookeeper管理你的应用集群

http://www.zlovezl.cn/articles/40/

简介：

　　Zookeeper 分布式服务框架是 Apache Hadoop 的一个子项目，它主要是用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等。

具体简介可以参照这篇文章。

zkpython的安装：

python中有一个zkpython的包，是基于zookeeper的c-client开发的，所以安装的时候需要先安装zookeeper的c客户端。安装步骤如下：

# 首先下载zookeeper

wget http://labs.renren.com/apache-mirror//zookeeper/zookeeper-3.3.3/zookeeper-3.3.3.tar.gz

tar xzvf zookeeper-3.3.3.tar.gz

cd zookeeper-3.3.3/src/c/

./configure

make

make install

# 然后下载zkpython

wget http://pypi.python.org/packages/source/z/zkpython/zkpython-0.4.tar.gz#md5=3de220615aaddf57f1462b78d32477f9

tar xzvf zkpython-0.4.tar.gz

cd zkpython-0.4

python setup.py install

这样就完成了zkpython的安装。

一个简单的demo：

之后让我们来写一个简单的demo吧。（demo中用到的zkclient.py:https://github.com/piglei/zkpython_example/blob/master/zkclient.py）

# coding: utf-8

import logging

from os.path import basename, join

from zkclient import ZKClient, zookeeper, watchmethod

logging.basicConfig(

    level = logging.DEBUG,

    format = "[%(asctime)s] %(levelname)-8s %(message)s"

)

log = logging

class GJZookeeper(object):

    ZK_HOST = "localhost:2181"

    ROOT = "/app"

    WORKERS_PATH = join(ROOT, "workers")

    MASTERS_NUM = 1

    TIMEOUT = 10000

    def __init__(self, verbose = True):

        self.VERBOSE = verbose

        self.masters = []

        self.is_master = False

        self.path = None

        self.zk = ZKClient(self.ZK_HOST, timeout = self.TIMEOUT)

        self.say("login ok!")

        # init

        self.__init_zk()

        # register

        self.register()

    def __init_zk(self):

        """

        create the zookeeper node if not exist

        """

        nodes = (self.ROOT, self.WORKERS_PATH)

        for node in nodes:

            if not self.zk.exists(node):

                try:

                    self.zk.create(node, "")

                except:

                    pass

    @property

    def is_slave(self):

        return not self.is_master

    def register(self):

        """

        register a node for this worker

        """

        self.path = self.zk.create(self.WORKERS_PATH + "/worker", "1", flags=zookeeper.EPHEMERAL | zookeeper.SEQUENCE)

        self.path = basename(self.path)

        self.say("register ok! I'm %s" % self.path)

        # check who is the master

        self.get_master()

    def get_master(self):

        """

        get children, and check who is the smallest child

        """

        @watchmethod

        def watcher(event):

            self.say("child changed, try to get master again.")

            self.get_master()

        children = self.zk.get_children(self.WORKERS_PATH, watcher)

        children.sort()

        self.say("%s's children: %s" % (self.WORKERS_PATH, children)) 

        # check if I'm master

        self.masters = children[:self.MASTERS_NUM]

        if self.path in self.masters:

            self.is_master = True

            self.say("I've become master!")

        else:

            self.say("%s is masters, I'm slave" % self.masters)

    def say(self, msg):

        """

        print messages to screen

        """

        if self.VERBOSE:

            if self.path:

                log.info("[ %s(%s) ] %s" % (self.path, "master" if self.is_master else "slave", msg))

            else:

                log.info(msg)

def main():

    gj_zookeeper = GJZookeeper()

if __name__ == "__main__":

    main()

    import time

    time.sleep(1000)

　　这个简单的demo所做的事情，就是通过在zookeeper的/app/workers节点下建立临时的子节点( flags=zookeeper.EPHEMERAL | zookeeper.SEQUENCE )，每次create完成之后检查自己是不是在最小的MASTERS_NUM(例子中为1，即单master)里。如果是的话，作为master运行，否则的话，作为slave运行。

　　这样的话，当我们的master挂掉以后，与zookeeper之间的连接也会中断，过了指定的TIMEOUT以后，master之前在worker下的子节点就会被删除，于是slave节点之前设置的watcher会被触发，再次检查自己是否为master，如果是的话则完成切换。

demo运行结果：

# 第一个实例

Connected in 20 ms, handle is 0

[2011-09-09 12:40:43,702] INFO     login ok!

Node /app/workers/worker created in 4 ms

[2011-09-09 12:40:43,708] INFO     [ worker0000000022(slave) ] register ok! I'm worker0000000022

[2011-09-09 12:40:43,709] INFO     [ worker0000000022(slave) ] /app/workers's children: ['worker0000000022']

[2011-09-09 12:40:43,709] INFO     [ worker0000000022(master) ] I've become master!

# 这时再起第二个实例

Connected in 64 ms, handle is 0

[2011-09-09 12:43:08,334] INFO     login ok!

Node /app/workers/worker created in 11 ms

[2011-09-09 12:43:08,346] INFO     [ worker0000000023(slave) ] register ok! I'm worker0000000023

[2011-09-09 12:43:08,347] INFO     [ worker0000000023(slave) ] /app/workers's children: ['worker0000000022', 'worker0000000023']

[2011-09-09 12:43:08,347] INFO     [ worker0000000023(slave) ] ['worker0000000022'] is masters, I'm slave

# 杀掉master，第二个实例发生的变化

[2011-09-09 12:44:06,016] INFO     [ worker0000000023(slave) ] child changed, try to get master again.

[2011-09-09 12:44:06,017] INFO     [ worker0000000023(slave) ] /app/workers's children: ['worker0000000023']

[2011-09-09 12:44:06,017] INFO     [ worker0000000023(master) ] I've become master!

在python中使用zookeeper管理你的应用集群的更多相关文章

Zookeeper管理多个HBase集群
zookeeper是hbase集群的"协调器".由于zookeeper的轻量级特性,因此我们可以将多个hbase集群共用一个zookeeper集群,以节约大量的服务器.多个hbas ...
(转)Python中的上下文管理器和Tornado对其的巧妙应用
原文:https://www.binss.me/blog/the-context-manager-of-python-and-the-applications-in-tornado/ 上下文是什么? ...
Python 中的内存管理
Python 中一切皆对象,这些对象的内存都是在运行时动态地在堆中进行分配的,就连 Python 虚拟机使用的栈也是在堆上模拟的.既然一切皆对象,那么在 Python 程序运行过程中对象的创建和释放就 ...
基于zookeeper+mesos+marathon的docker集群管理平台
参考文档: mesos:http://mesos.apache.org/ mesosphere社区版:https://github.com/mesosphere/open-docs mesospher ...
ZooKeeper之（五）集群管理
在一台机器上运营一个ZooKeeper实例,称之为单机(Standalone)模式.单机模式有个致命的缺陷,一旦唯一的实例挂了,依赖ZooKeeper的应用全得完蛋. 实际应用当中,一般都是采用集群模 ...
Dubbo+zookeeper构建高可用分布式集群（二）-集群部署
在Dubbo+zookeeper构建高可用分布式集群(一)-单机部署中我们讲了如何单机部署.但没有将如何配置微服务.下面分别介绍单机与集群微服务如何配置注册中心. Zookeeper单机配置:方式一. ...
zookeeper、solrcloud、rediscluster集群解决方案
集群解决方案课程目标目标1:说出什么是集群以及与分布式的区别目标2:能够搭建Zookeeper集群目标3:能够搭建SolrCloud集群目标4:能够搭建RedisCluster集群 ...
有关python numpy pandas scipy 等能在YARN集群上运行PySpark
有关这个问题,似乎这个在某些时候,用python写好,且spark没有响应的算法支持, 能否能在YARN集群上运行PySpark方式, 将python分析程序提交上去? Spark Applicat ...
ZooKeeper环境搭建（单机/集群）（转）
前提: 配置文件主要是在$ZOOKEEPER_HOME/conf/zoo.cfg,刚解压时为zoo_sample.cfg,重命名zoo.cfg即可. 配置文件常用项参考:http://www.cnbl ...

随机推荐

activity-intent-startActivity-startActivityResult
一. Intent和startActivity 1.在一个Activtiy中可以使用startActivity()去开始另一个制定的Activity 但在android3.0(是针对平板出的产品)之后 ...
学习PHP时的一些总结（二）
类中的构造方法和析构方法: 构造方法是对象创建完成后第一个被对象自动调用的方法.析构方法是对象在销毁之前最后一个被对象自动调用的方法. 如果没有显示的声明构造方法,类中都会默认存在一个没有参数列表并且 ...
Android 自定义View修炼-自定义HorizontalScrollView视图实现仿ViewPager效果
开发过程中,需要达到 HorizontalScrollView和ViewPager的效果,于是直接重写了HorizontalScrollView来达到实现ViewPager的效果. 实际效果图如下: ...
angularjs 根据变量改变动态加载模板
directive return { restrict: 'E', replace: true, templateUrl: 'app/view/order.html', link: function ...
父页面iframe自动适应子页面的宽高度
<script type="text/javascript"> function load(){ parent.document.getElementById(&quo ...
sql if
SELECT a.id, a.EduSiteNo, a.EduSiteName, a.SchoolId, a.LinkMan, a.Tel, a.Mobile, a.Fax, a.Address, C ...
（转）css换行样式：word-wrap同word-break的区别
以下是引用片段: word-wrap:break-word; overflow:hidden; 而不是以下是引用片段: word-wrap:break-word; word-break:break- ...
Spring JdbcTemplate批量操作数据库
个人总结,转载请注明出处:http://www.cnblogs.com/lidabnu/p/5769732.html 还是分两部分:解决什么问题和怎么做. 解决什么问题提升数据操作性能,因为批量操作 ...
(转)C# NameValueCollection集合
1.NameValueCollection类集合是基于 NameObjectCollectionBase 类. 但与 NameObjectCollectionBase 不同,该类在一个键下存储多个字符 ...
Apache Hadoop2.0之HDFS均衡操作分析
1 HDFS均衡操作原理 HDFS默认的块的副本存放策略是在发起请求的客户端存放一个副本,如果这个客户端在集群以外,那就选择一个不是太忙,存储不是太满的节点来存放,第二个副本放在与第一个副本相同的机架 ...

在python中使用zookeeper管理你的应用集群

在python中使用zookeeper管理你的应用集群的更多相关文章

随机推荐

热门专题