徒手教你使用zookeeper编写服务发现

　　zookeeper是一个强一致【不严格】的分布式数据库，由多个节点共同组成一个分布式集群，挂掉任意一个节点，数据库仍然可以正常工作，客户端无感知故障切换。客户端向任意一个节点写入数据，其它节点可以立即看到最新的数据。

　　zookeeper的内部是一个key/value存储引擎，key是以树状的形式构成了一个多级的层次结构，每一个节点既可以存储数据，又可以作为一个目录存放下一级子节点。

　　zookeeper提供了创建/修改/删除节点的api，如果父节点没有创建，字节点会创建失败。如果父节点还有子节点，父节点不可以被删除。

　　zookeeper和客户端之间以socket形式进行双向通讯，客户端可以主动调用服务器提供的api，服务器可以主动向客户端推送事件。有多种事件可以watch，比如节点的增删改，子节点的增删改，会话状态变更等。

　　zookeeper的事件有传递机制，字节点的增删改触发的事件会向上层依次传播，所有的父节点都可以收到字节点的数据变更事件，所以层次太深/子节点太多会给服务器的事件系统带来压力，节点分配要做好周密的规划。

　　zookeeper满足了CAP定理的分区容忍性P和强一致性C，牺牲了高性能A【可用性蕴含性能】。zookeeper的存储能力是有限的，当节点层次太深/子节点太多/节点数据太大，都会影响数据库的稳定性。所以zookeeper不是一个用来做高并发高性能的数据库，zookeeper一般只用来存储配置信息。

　　zookeeper的读性能随着节点数量的提升能不断增加，但是写性能会随着节点数量的增加而降低，所以节点的数量不宜太多，一般配置成3个或者5个就可以了。

　　图中可以看出当服务器节点增多时，复杂度会随之提升。因为每个节点和其它节点之间要进行p2p的连接。3个节点可以容忍挂掉1个节点，5个节点可以容忍挂掉2个节点。

　　客户端连接zookeeper时会选择任意一个节点保持长链接，后续通信都是通过这个节点进行读写的。如果该节点挂了，客户端会尝试去连接其它节点。

　　服务器会为每个客户端连接维持一个会话对象，会话的ID会保存在客户端。会话对象也是分布式的，意味着当一个节点挂掉了，客户端使用原有的会话ID去连接其它节点，服务器维持的会话对象还继续存在，并不需要重新创建一个新的会话。

　　如果客户端主动发送会话关闭消息，服务器的会话对象会立即删除。如果客户端不小心奔溃了，没有发送关闭消息，服务器的会话对象还会继续存在一段时间。这个时间是会话的过期时间，在创建会话的时候客户端会提供这个参数，一般是10到30秒。

　　也许你会问连接断开了，服务器是可以感知到的，为什么需要客户端主动发送关闭消息呢?

　　因为服务器要考虑网络抖动的情况，连接可能只是临时断开了。为了避免这种情况下反复创建和销毁复杂的会话对象以及创建会话后要进行的一系列事件初始化操作，服务器会尽量延长会话的生存时间。

　　zookeeper的节点可以是持久化(Persistent)的，也可以是临时(Ephermeral)的。所谓临时的节点就是会话关闭后，会话期间创建的所有临时节点会立即消失。一般用于服务发现系统，将服务进程的生命期和zookeeper子节点的生命期绑定在一起，起到了实时监控服务进程的存活的效果。

　　zookeeper还提供了顺序节点。类似于mysql里面的auto_increment属性。服务器会在顺序节点名称后自动增加自增的唯一后缀，保持节点名称的唯一性和顺序性。

　　还有一种节点叫着保护(Protected)节点。这个节点非常特殊，但是也非常常用。在应用服务发现的场合时，客户端创建了一个临时节点后，服务器节点挂了，连接断开了，然后客户端去重连到其它的节点。因为会话没有关闭，之前创建的临时节点还存在，但是这个时候客户端却无法识别去这个临时节点是不是自己创建的，因为节点内部并不存储会话ID字段。所以客户端会在节点名称上加上一个GUID前缀，这个前缀会保存在客户端，这样它就可以在重连后识别出哪个临时节点是自己之前创建的了。

　　接下来我们使用Go语言实现一下服务发现的注册和发现功能。

　　如图所示，我们要提供api.user这样的服务，这个服务有3个节点，每个节点有不一样的服务地址，这3个节点各自将自己的服务注册进zk，然后消费者进行读取zk得到api.user的服务地址，任选一个节点地址进行服务调用。为了简单化，这里就没有提供权重参数了。在一个正式的服务发现里一般都有权重参数，用于调整服务节点之间的流量分配。

　　go get github.com/samuel/go-zookeeper/zk

　　首先我们定义一个ServiceNode结构，这个结构数据会存储在节点的data中，表示服务发现的地址信息。

　　type ServiceNode struct {

　　Name string `json:"name"` // 服务名称，这里是user

　　Host string `json:"host"`

　　Port int `json:"port"`}

　　在定义一个服务发现的客户端结构体SdClient。

　　type SdClient struct {

　　zkServers []string // 多个节点地址

　　zkRoot string // 服务根节点，这里是/api

　　conn *zk.Conn // zk的客户端连接}

　　编写构造器，创建根节点

　　func NewClient(zkServers []string, zkRoot string, timeout int) (*SdClient, error) {

　　client := new(SdClient)

　　client.zkServers = zkServers

　　client.zkRoot = zkRoot

　　// 连接服务器

　　conn, _, err := zk.Connect(zkServers, time.Duration(timeout)*time.Second)

　　if err != nil {

　　return nil, err

　　}

　　client.conn = conn

　　// 创建服务根节点

　　if err := client.ensureRoot(); err != nil {

　　client.Close()

　　return nil, err

　　}

　　return client, nil}// 关闭连接，释放临时节点func (s *SdClient) Close() {

　　s.conn.Close()}func (s *SdClient) ensureRoot() error {

　　exists, _, err := s.conn.Exists(s.zkRoot)

　　if err != nil {

　　return err

　　}

　　if !exists {

　　_, err := s.conn.Create(s.zkRoot, []byte(""), 0, zk.WorldACL(zk.PermAll))

　　if err != nil && err != zk.ErrNodeExists {

　　return err

　　}

　　return nil}

　　值得注意的是代码中的Create调用可能会返回节点已存在错误，这是正常现象，因为会存在多进程同时创建节点的可能。如果创建根节点出错，还需要及时关闭连接。我们不关心节点的权限控制，所以使用zk.WorldACL(zk.PermAll)表示该节点没有权限限制。Create参数中的flag=0表示这是一个持久化的普通节点。

　　接下来我们编写服务注册方法

　　func (s *SdClient) Register(node *ServiceNode) error {

　　if err := s.ensureName(node.Name); err != nil {

　　return err

　　}

　　path := s.zkRoot + "/" + node.Name + "/n"

　　data, err := json.Marshal(node)

　　if err != nil {

　　return err

　　}

　　_, err = s.conn.CreateProtectedEphemeralSequential(path, data, zk.WorldACL(zk.PermAll))

　　if err != nil {

　　return err

　　}

　　return nil}func (s *SdClient) ensureName(name string) error {

　　path := s.zkRoot + "/" + name

　　exists, _, err := s.conn.Exists(path)

　　if err != nil {

　　return err

　　}

　　if !exists {

　　_, err := s.conn.Create(path, []byte(""), 0, zk.WorldACL(zk.PermAll))

　　if err != nil && err != zk.ErrNodeExists {

　　return err

　　}

　　return nil}

　　先要创建/api/user节点作为服务列表的父节点。然后创建一个保护顺序临时(ProtectedEphemeralSequential)子节点，同时将地址信息存储在节点中。什么叫保护顺序临时节点，首先它是一个临时节点，会话关闭后节点自动消失。其它它是个顺序节点，zookeeper自动在名称后面增加自增后缀，确保节点名称的唯一性。同时还是个保护性节点，节点前缀增加了GUID字段，确保断开重连后临时节点可以和客户端状态对接上。

　　接下来我们实现消费者获取服务列表方法无锡人流医院：http://www.bhnkyy39.com/

　　func (s *SdClient) GetNodes(name string) ([]*ServiceNode, error) {

　　path := s.zkRoot + "/" + name

　　// 获取字节点名称

　　childs, _, err := s.conn.Children(path)

　　if err != nil {

　　if err == zk.ErrNoNode {

　　return []*ServiceNode{}, nil

　　}

　　return nil, err

　　}

　　nodes := []*ServiceNode{}

　　for _, child := range childs {

　　fullPath := path + "/" + child

　　data, _, err := s.conn.Get(fullPath)

　　if err != nil {

　　if err == zk.ErrNoNode {

　　continue

　　}

　　return nil, err

　　}

　　node := new(ServiceNode)

　　err = json.Unmarshal(data, node)

　　if err != nil {

　　return nil, err

　　}

　　nodes = append(nodes, node)

　　}

　　return nodes, nil}

　　获取服务节点列表时，我们先获取字节点的名称列表，然后依次读取内容拿到服务地址。因为获取字节点名称和获取字节点内容不是一个原子操作，所以在调用Get获取内容时可能会出现节点不存在错误，这是正常现象。

　　将以上代码凑在一起，一个简单的服务发现包装就实现了。

　　最后我们看看如果使用以上代码，为了方便起见，我们将多个服务提供者和消费者写在一个main方法里。

　　func main() {

　　// 服务器地址列表

　　servers := []string{"192.168.0.101:2118", "192.168.0.102:2118", "192.168.0.103:2118"}

　　client, err := NewClient(servers, "/api", 10)

　　if err != nil {

　　panic(err)

　　}

　　defer client.Close()

　　node1 := &ServiceNode{"user", "127.0.0.1", 4000}

　　node2 := &ServiceNode{"user", "127.0.0.1", 4001}

　　node3 := &ServiceNode{"user", "127.0.0.1", 4002}

　　if err := client.Register(node1); err != nil {

　　panic(err)

　　}

　　if err := client.Register(node2); err != nil {

　　panic(err)

　　}

　　if err := client.Register(node3); err != nil {

　　panic(err)

　　}

　　nodes, err := client.GetNodes("user")

　　if err != nil {

　　panic(err)

　　}

　　for _, node := range nodes {

　　fmt.Println(node.Host, node.Port)

　　}}

　　值得注意的是使用时一定要在进程退出前调用Close方法，否则zookeeper的会话不会立即关闭，服务器创建的临时节点也就不会立即消失，而是要等到timeout之后服务器才会清理。

徒手教你使用zookeeper编写服务发现的更多相关文章

阿里巴巴为什么不用 ZooKeeper 做服务发现？
阿里巴巴为什么不用 ZooKeeper 做服务发现? http://jm.taobao.org/2018/06/13/%E5%81%9A%E6%9C%8D%E5%8A%A1%E5%8F%91%E7%8 ...
【转帖】为什么不要把ZooKeeper用于服务发现
http://www.infoq.com/cn/news/2014/12/zookeeper-service-finding ZooKeeper是Apache基金会下的一个开源的.高可用的分布式应用协 ...
为什么不应该使用Zookeeper做服务发现？（转载）
转载自: http://dockone.io/article/78 [编者的话]本文作者通过ZooKeeper与Eureka作为Service发现服务(注:WebServices体系中的UDDI就是个 ...
为什么不应该使用ZooKeeper做服务发现
[编者的话]本文作者通过ZooKeeper与Eureka作为Service发现服务(注:WebServices体系中的UDDI就是个发现服务)的优劣对比,分享了Knewton在云计算平台部署服务的经验 ...
zookeeper服务发现实战及原理--spring-cloud-zookeeper源码分析
1.为什么要服务发现? 服务实例的网络位置都是动态分配的.由于扩展.失败和升级,服务实例会经常动态改变,因此,客户端代码需要使用更加复杂的服务发现机制. 2.常见的服务发现开源组件 etcd—用于共享 ...
服务发现框架选型: Consul、Zookeeper还是etcd ？
背景本文并不介绍服务发现的基本原理.除了一致性算法之外,其他并没有太多高深的算法,网上的资料很容易让大家明白上面是服务发现.想直接查看结论的同学,请直接跳到文末.目前,市面上有非常多的服务发现工具, ...
服务发现框架选型，Consul还是Zookeeper还是etcd
背景本文并不介绍服务发现的基本原理.除了一致性算法之外,其他并没有太多高深的算法,网上的资料很容易让大家明白上面是服务发现. 想直接查看结论的同学,请直接跳到文末. 目前,市面上有非常多的服务发现工 ...
k8s全方位监控-prometheus-配置文件介绍以及基于文件服务发现
1.scrape_configs 参数介绍 # 默认的全局配置 global: scrape_interval: 15s # 采集间隔15s,默认为1min一次 evaluation_interval ...
服务注册发现consul之三：服务发现比较:Consul vs Zookeeper vs Etcd vs Eureka
这里就平时经常用到的服务发现的产品进行下特性的对比,首先看下结论: Feature Consul zookeeper etcd euerka 服务健康检查服务状态,内存,硬盘等 (弱)长连接,kee ...

随机推荐

Cinder服务使用
Cinder环境 Cinder配置重新创建卷组cinder-volumes [root@openstack centos]# vgremove cinder-volumes Configuratio ...
剑指Offer的学习笔记（C#篇）-- 链表中倒数第K个点
题目描述输入一个链表,输出该链表中倒数第k个结点. 一 . 数据结构基础概念普及(线性表). 线性表可分为顺序表与链表,它们是堆栈.队列.树.图等数据结构的实现基础. 顺序表,线性表的顺序存储结构是 ...
12.Python略有小成(生成器,推导式,内置函数,闭包)
Python(生成器,推导式,内置函数,闭包) 一.生成器初始生成器的本质就是迭代器,python社区中认为生成器与迭代器是一种生成器与迭代器的唯一区别,生成器是我们自己用python代码构建成的 ...
thinkphp5实现mysql数据库还原
数据库还原其实就是从.sql文件中读取一行一行的命令,然后执行需要配置数据库文件database.php,数据库名,主机名,用户名,密码这里就不说了,这里说的要配置数据库连接参数 'params' ...
JavaScript进阶 - 第6章事件响应，让网页交互
6-1什么是事件 JavaScript 创建动态页面.事件是可以被 JavaScript 侦测到的行为. 网页中的每个元素都可以产生某些可以触发 JavaScript 函数或程序的事件. 比如说,当用 ...
Codeforces 548E（莫反、容斥）
转化为质数域上的操作,如果用莫反的话,记录因数的cnt. 其实莫反的推式子最后和容斥做法殊途同归了,容斥的系数就是莫比乌斯函数. const int maxn = 2e5 + 5, maxa = 5e ...
HDU6442（二项式）
要点懒得打公式了,题解把题目要求的复杂公式化简成熟悉的东西,一是看穿前面加个\(n!\)化为\(C_n^i,i为奇数\):二是将奇数的条件去掉的数学技巧. 形为\({(a + b\sqrt{B}) ...
java.sql.SQLException: No suitable driver found for jdbc:hive://localhost:10000/default
error: java.sql.SQLException: No suitable driver found for jdbc:hive://localhost:10000/default at ja ...
Netty-flush
TimerServer: ch.pipeline().addLast(new TimeEncoder()); ch.pipeline().addLast(new TimeServerHandler() ...
NOPI Excel 读取公式生成后的数据
using NPOI.HSSF.UserModel; using NPOI.SS.UserModel; using NPOI.XSSF.UserModel; using System; using S ...

徒手教你使用zookeeper编写服务发现

徒手教你使用zookeeper编写服务发现的更多相关文章

随机推荐

热门专题