自己实现一个一致性 Hash 算法

前言

在前文分布式理论(八)—— Consistent Hash（一致性哈希算法）中，我们讨论了一致性 hash 算法的原理，并说了，我们会自己写一个简单的算法。今天就来写一个。

普通 hash 的结果

先看看普通 hash 怎么做。

首先，需要缓存节点对象，缓存中的存储对象，还有一个缓存节点集合，用于保存有效的缓存节点。

实际存储对象，很简单的一个类，只需要获取他的 hash 值就好：

  static class Obj {

    String key;

    Obj(String key) {

      this.key = key;

    }

    @Override

    public int hashCode() {

      return key.hashCode();

    }

    @Override

    public String toString() {

      return "Obj{" +

          "key='" + key + '\'' +

          '}';

    }

  }

缓存节点对象，用于存储实际对象：

  static class Node {

    Map<Integer, Obj> node = new HashMap<>();

    String name;

    Node(String name) {

      this.name = name;

    }

    public void putObj(Obj obj) {

      node.put(obj.hashCode(), obj);

    }

    Obj getObj(Obj obj) {

      return node.get(obj.hashCode());

    }

    @Override

    public int hashCode() {

      return name.hashCode();

    }

  }

也很简单，内部使用了一个 map 保存节点。

缓存节点集合，用于保存有效的缓存节点：

 static class NodeArray {

    Node[] nodes = new Node[1024];

    int size = 0;

    public void addNode(Node node) {

      nodes[size++] = node;

    }

    Obj get(Obj obj) {

      int index = obj.hashCode() % size;

      return nodes[index].getObj(obj);

    }

    void put(Obj obj) {

      int index = obj.hashCode() % size;

      nodes[index].putObj(obj);

    }

  }

内部一个数组，取数据时，通过取余机器数量获取缓存节点，再从节点中取出数据。

测试：当增减节点时，还能不能找到原有数据：

 /**

   * 验证普通 hash 对于增减节点，原有会不会出现移动。

   */

  public static void main(String[] args) {

    NodeArray nodeArray = new NodeArray();

    Node[] nodes = {

        new Node("Node--> 1"),

        new Node("Node--> 2"),

        new Node("Node--> 3")

    };

    for (Node node : nodes) {

      nodeArray.addNode(node);

    }

    Obj[] objs = {

        new Obj("1"),

        new Obj("2"),

        new Obj("3"),

        new Obj("4"),

        new Obj("5")

    };

    for (Obj obj : objs) {

      nodeArray.put(obj);

    }

    validate(nodeArray, objs);

  }

  private static void validate(NodeArray nodeArray, Obj[] objs) {

    for (Obj obj : objs) {

      System.out.println(nodeArray.get(obj));

    }

    nodeArray.addNode(new Node("anything1"));

    nodeArray.addNode(new Node("anything2"));

    System.out.println("========== after  =============");

    for (Obj obj : objs) {

      System.out.println(nodeArray.get(obj));

    }

  }

测试步骤如下：

向集合中添加 3 个节点。
向 集群 中添加 5 个对象，这 5 个对象会根据 hash 值散列到不同的节点中。
打印 未增减前 的数据。
打印 增加 2 个节点 后数据，看看还能不能访问到数据。

结果：

一个都访问不到了。这就是普通的取余的缺点，在增减机器的情况下，这种结果无法接收。

再看看一致性 hash 如何解决。

一致性 Hash 的结果

关键的地方来了。

缓存节点对象和实际保存对象不用更改，改的是什么？

改的是保存对象的方式和取出对象的方式，也就是不使用对机器进行取余的算法。

新的 NodeArray 对象如下：

static class NodeArray {

/** 按照 键 排序*/

TreeMap<Integer, Node> nodes = new TreeMap<>();

void addNode(Node node) {

  nodes.put(node.hashCode(), node);

}

void put(Obj obj) {

  int objHashcode = obj.hashCode();

  Node node = nodes.get(objHashcode);

  if (node != null) {

    node.putObj(obj);

    return;

  }

  // 找到比给定 key 大的集合

  SortedMap<Integer, Node> tailMap = nodes.tailMap(objHashcode);

  // 找到最小的节点

  int nodeHashcode = tailMap.isEmpty() ? nodes.firstKey() : tailMap.firstKey();

  nodes.get(nodeHashcode).putObj(obj);

}

Obj get(Obj obj) {

  Node node = nodes.get(obj.hashCode());

  if (node != null) {

    return node.getObj(obj);

  }

  // 找到比给定 key 大的集合

  SortedMap<Integer, Node> tailMap = nodes.tailMap(obj.hashCode());

  // 找到最小的节点

  int nodeHashcode = tailMap.isEmpty() ? nodes.firstKey() : tailMap.firstKey();

  return nodes.get(nodeHashcode).getObj(obj);

}

}

该类和之前的类的不同之处在于：

内部没有使用数组，而是使用了有序 Map。
put 方法中，对象如果没有落到缓存节点上，就找比他小的节点且离他最近的。这里我们使用了 TreeMap 的 tailMap 方法，具体 API 可以看文档。
get 方法中，和 put 步骤相同，否则是取不到对象的。

具体寻找节点的方式如图：

相同的测试用例，执行结果如下：

找到了之前所有的节点。解决了普通 hash 的问题。

总结

代码比较简单，主要是通过 JDK 自带的 TreeMap 实现的寻找临近节点。当然，我们这里也只是测试了添加，关于修改还没有测试，但思路是一样的。这里只是做一个抛砖引玉。

同时，我们也没有实现虚拟节点，感兴趣的朋友可以尝试一下。

good luck！！！！

自己实现一个一致性 Hash 算法的更多相关文章

对一致性Hash算法，Java代码实现的深入研究
一致性Hash算法关于一致性Hash算法,在我之前的博文中已经有多次提到了,MemCache超详细解读一文中"一致性Hash算法"部分,对于为什么要使用一致性Hash算法.一致性 ...
一致性hash算法详解
转载请说明出处:http://blog.csdn.net/cywosp/article/details/23397179 一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT) ...
一致性hash算法简介
一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT)实现算法,设计目标是为了解决因特网中的热点(Hot spot)问题,初衷和CARP十分类似.一致性哈希修正了CARP使用的简单哈希 ...
分布式缓存技术memcached学习（四）—— 一致性hash算法原理
分布式一致性hash算法简介当你看到“分布式一致性hash算法”这个词时,第一时间可能会问,什么是分布式,什么是一致性,hash又是什么.在分析分布式一致性hash算法原理之前,我们先来了解一下这几 ...
一致性 hash 算法（ consistent hashing ）a
一致性 hash 算法( consistent hashing ) 张亮 consistent hashing 算法早在 1997 年就在论文 Consistent hashing and rando ...
一致性hash算法简介与代码实现
一.简介: 一致性hash算法提出了在动态变化的Cache环境中,判定哈希算法好坏的四个定义: 1.平衡性(Balance) 2.单调性(Monotonicity) 3.分散性(Spread) 4.负 ...
memcache的一致性hash算法使用
一.概述 1.我们的memcache客户端(这里我看的spymemcache的源码),使用了一致性hash算法ketama进行数据存储节点的选择.与常规的hash算法思路不同,只是对我们要存储数据的k ...
一致性Hash算法在Redis分布式中的使用
由于redis是单点,但是项目中不可避免的会使用多台Redis缓存服务器,那么怎么把缓存的Key均匀的映射到多台Redis服务器上,且随着缓存服务器的增加或减少时做到最小化的减少缓存Key的命中率呢? ...
【转载】一致性hash算法释义
http://www.cnblogs.com/haippy/archive/2011/12/10/2282943.html 一致性Hash算法背景一致性哈希算法在1997年由麻省理工学院的Karge ...

随机推荐

Python自动化开发 - 常用模块(二)
本节内容 1.shutil模块 2.shelve模块 3.xml处理模块 4.configparser模块 5.hashlib模块 6.subprocess模块 7.re模块一.shutil模块高 ...
A - Class Statistics
A - Class Statistics Time Limit:3000MS Memory Limit:0KB 64bit IO Format:%lld & %llu Subm ...
行人检测(Pedestrian Detection)资源
一.论文综述类的文章 [1]P.Dollar, C. Wojek,B. Schiele, et al. Pedestrian detection: an evaluation of the stat ...
动态执行 VB.NET 和 C# 代码
有时候我们需要尝试动态地与一些代码进行交互,而不是只能执行程序内已编死的代码,那该怎么办呢?我首先推荐各种脚本语言,如Javascript.Lua.Python等等,这些脚本语言有很多优秀的第三方类库 ...
spring cloud学习(一) 服务注册
首先spring-cloud相关的简介可以去百度搜索,这里就不多说了,这里分享一个翻译spring cloud官网的中文网站spring cloud中文网这个学习项目的代码放在 https://gi ...
GoLang学习控制语句之字符串
Go语言字符串是一种值类型,且值不可变,即创建某个文本后你无法再次修改这个文本的内容:更深入地讲,字符串是字节的定长数组.Go 代码使用 UTF-8 编码(且不能带 BOM),同时标识符支持 Unic ...
【ElasticSearch】：索引Index、文档Document、字段Field
因为从ElasticSearch6.X开始,官方准备废弃Type了.对应数据库,对ElasticSearch的理解如下: ElasticSearch 索引Index 文档Document 字段Fiel ...
JavaScript 的 Async\/Await 完胜 Promise 的六
参考:http://www.10tiao.com/html/558/201705/2650964601/1.html Node 现在从版本 7.6 开始就支持 async/await 了. 简介: A ...
Nginx安装使用及与tomcat实现负载均衡
1. 背景基于nginx强大的功能,实现一种负载均衡,或是不停机更新程序等.nginx相比大家基本上都知道是什么来头了,具体的文章大家可以去搜索相关文章学习阅读,或是可以查看Nginx中文文档和Ng ...
关于oracle RAC心跳线采用直连还是交换机连接的建议
关于oracle RAC心跳线的连接方式,各个论坛,包括网上文章的说法是:官方说是不建议直连,建议采用交换机连接的方式!PS:但是,一直没有找到官方文档的出处,有知道的兄弟,烦请评论区提供下地址!!! ...

自己实现一个一致性 Hash 算法

前言

普通 hash 的结果

一致性 Hash 的结果

总结

自己实现一个一致性 Hash 算法的更多相关文章

随机推荐

热门专题