简单解释:

简单解释一致性hash的原理:网上通篇都是用服务器做的举例,我这里也如此,主要是便于理解。

通常:有N个客户端请求服务器,假设有M台web服务器,通常为了均衡访问会进行N%M的取模,然后分配到不同的缓存服务器访问。问题是一旦缓存服务器增加或减少时缓存的命中率被打乱,因为取模发生了变化。例A的访问分配到了M1上,假设服务器增减则有可能会被分配到M3上(M3为举例),那么M1上的原有缓存失效,M3需要重新建立A访问的缓存。

一致性Hash:有N个客户端请求服务器,假设有M台web服务器,把其中一个请求做HASH,M台服务器也做HASH,采用Sortedmap的tailMap特性,检索顺时针最近的一台服务器作为缓存服务器;

例:其中一个请求HASHCODE=254,M台服务器HASH后分别为1、58、648...(数字为举例),那么通过Sortedmap的tailMap特性可以找到648以及后面的服务器,则把最近的648作为缓存服务器。当然 如果tailMap找到的为NULL,则从Sortedmap的第一条key作为缓存服务器(保证map是一个环装)

简单代码:

完整代码示意-摘自互联网的代码(整理后),可以参考。

  1. package com.yiibai;
  2.  
  3. import java.util.*;
  4.  
  5. public class TreeMapDemo {
  6. public static void main(String[] args) {
  7. // creating maps
  8. TreeMap<Integer, String> treemap = new TreeMap<Integer, String>();
  9. SortedMap<Integer, String> treemapincl = new TreeMap<Integer, String>();
  10.  
  11. // populating tree map
  12. treemap.put(2, "two");
  13. treemap.put(1, "one");
  14. treemap.put(3, "three");
  15. treemap.put(6, "six");
  16. treemap.put(5, "five");
  17.  
  18. System.out.println("Getting tail map");
  19. treemapincl=treemap.tailMap(3);
  20. System.out.println("Tail map values: "+treemapincl);
  21. }
  22. }

完整代码示意-摘自互联网的代码(整理后),可以参考。

  1. import java.util.ArrayList;
  2. import java.util.HashMap;
  3. import java.util.List;
  4. import java.util.Map;
  5. import java.util.Map.Entry;
  6. import java.util.SortedMap;
  7. import java.util.TreeMap;
  8.  
  9. import org.apache.commons.codec.digest.DigestUtils;
  10.  
  11. public class VNode {
  12. private SortedMap<Integer, String> serverNodeMap = null;
  13.  
  14. private final static int VIRTUAL_NODE_NUMBER = 5;
  15.  
  16. public void getServerNodeWithoutVirtualNode(List<String> servers)
  17. {
  18. serverNodeMap = new TreeMap<Integer, String>();
  19. for (String string : servers)
  20. {
  21. serverNodeMap.put(hash(string), string);
  22. }
  23. }
  24.  
  25. public void getServerNodeWithVirtualNode(List<String> servers)
  26. {
  27. serverNodeMap = new TreeMap<Integer, String>();
  28. for (String string : servers)
  29. {
  30. for (int i = 0; i < VIRTUAL_NODE_NUMBER; i++)
  31. {
  32. String virtualNodeName = string + ":" + i;
  33. serverNodeMap.put(hash(virtualNodeName), string);
  34. }
  35. }
  36. }
  37.  
  38. public String getServerName(String data)
  39. {
  40. int dataHash = hash(data);
  41. SortedMap<Integer, String> subMap = serverNodeMap.tailMap(dataHash);
  42. int serverHash = 0;
  43. if (subMap == null || subMap.size() == 0)
  44. {
  45. serverHash = serverNodeMap.firstKey();
  46. }
  47. else
  48. {
  49. serverHash = subMap.firstKey();
  50. }
  51.  
  52. String serverName = serverNodeMap.get(serverHash);
  53. return serverName;
  54.  
  55. }
  56.  
  57. /**
  58. * hash计算,这里使用md5后取hashcode,这个md5需要依赖apache的codec包
  59. * @param str
  60. * @return
  61. */
  62. public int hash(String str)
  63. {
  64. //System.out.println(str+"的hashcode="+DigestUtils.md5Hex(str).hashCode());
  65. return DigestUtils.md5Hex(str).hashCode();
  66. }
  67.  
  68. public static void main(String[] args)
  69. {
  70. List<String> servers = new ArrayList<String>();
  71. servers.add("192.168.1.1");
  72. servers.add("192.168.1.2");
  73. servers.add("192.168.1.3");
  74. servers.add("192.168.1.4");
  75. servers.add("192.168.1.5");
  76. servers.add("192.168.1.6");
  77.  
  78. List<String> datas = new ArrayList<String>();
  79. datas.add("A");
  80. datas.add("B");
  81. datas.add("C");
  82. datas.add("D");
  83. datas.add("E");
  84. datas.add("F");
  85. datas.add("G");
  86. datas.add("H");
  87. datas.add("I");
  88.  
  89. VNode consistentHash = new VNode();
  90. System.out.println("没有虚拟节点的情况:");
  91. consistentHash.getServerNodeWithoutVirtualNode(servers);
  92. consistentHash.printDataAndServerNode(servers, datas, consistentHash);
  93. System.out.println("有虚拟节点的情况:");
  94. consistentHash.getServerNodeWithVirtualNode(servers);
  95. consistentHash.printDataAndServerNode(servers, datas, consistentHash);
  96.  
  97. servers.add("192.168.1.7");
  98. System.out.println("增加第一个一个节点后:");
  99. System.out.println("没有虚拟节点的情况:");
  100. consistentHash.getServerNodeWithoutVirtualNode(servers);
  101. consistentHash.printDataAndServerNode(servers, datas, consistentHash);
  102. System.out.println("有虚拟节点的情况:");
  103. consistentHash.getServerNodeWithVirtualNode(servers);
  104. consistentHash.printDataAndServerNode(servers, datas, consistentHash);
  105.  
  106. servers.remove(0);
  107. System.out.println("移除第一个一个节点后:");
  108. System.out.println("没有虚拟节点的情况:");
  109. consistentHash.getServerNodeWithoutVirtualNode(servers);
  110. consistentHash.printDataAndServerNode(servers, datas, consistentHash);
  111. System.out.println("有虚拟节点的情况:");
  112. consistentHash.getServerNodeWithVirtualNode(servers);
  113. consistentHash.printDataAndServerNode(servers, datas, consistentHash);
  114.  
  115. }
  116.  
  117. public void printDataAndServerNode(List<String> servers, List<String> datas,VNode consistentHash)
  118. {
  119. Map<String, String> result = new HashMap<String, String>();
  120. for (String data : datas)
  121. {
  122. String serverName = consistentHash.getServerName(data);
  123. if (!result.containsKey(serverName))
  124. {
  125. result.put(serverName, data);
  126. }
  127. else
  128. {
  129. result.put(serverName, result.get(serverName) + "," + data);
  130. }
  131. }
  132.  
  133. for (Entry<String, String> entry : result.entrySet())
  134. {
  135. System.out.println(entry.getKey()+":"+entry.getValue());
  136. }
  137. }
  138. }

一致性hash(整理版)的更多相关文章

  1. 转载自lanceyan: 一致性hash和solr千万级数据分布式搜索引擎中的应用

    一致性hash和solr千万级数据分布式搜索引擎中的应用 互联网创业中大部分人都是草根创业,这个时候没有强劲的服务器,也没有钱去买很昂贵的海量数据库.在这样严峻的条件下,一批又一批的创业者从创业中获得 ...

  2. 一致性 hash 算法( consistent hashing )a

    一致性 hash 算法( consistent hashing ) 张亮 consistent hashing 算法早在 1997 年就在论文 Consistent hashing and rando ...

  3. 一致性Hash算法在Redis分布式中的使用

    由于redis是单点,但是项目中不可避免的会使用多台Redis缓存服务器,那么怎么把缓存的Key均匀的映射到多台Redis服务器上,且随着缓存服务器的增加或减少时做到最小化的减少缓存Key的命中率呢? ...

  4. 一致性hash和solr千万级数据分布式搜索引擎中的应用

    互联网创业中大部分人都是草根创业,这个时候没有强劲的服务器,也没有钱去买很昂贵的海量数据库.在这样严峻的条件下,一批又一批的创业者从创业中 获得成功,这个和当前的开源技术.海量数据架构有着必不可分的关 ...

  5. python -- 一致性Hash

    python有一个python模块--hash_ring,即python中的一致性hash,使用起来也挺简单. 可以参考下官方例子:https://pypi.python.org/pypi/hash_ ...

  6. 一致性 Hash 学习与实现

    普通的 Hash 解决的是什么问题? 下图是一个普通的余数法构造的哈希表. 一般在编程中使用哈希表,某个 bucket 突然就没了的概率比较小,常见的是因为负载因子太大需要增加 bucket,然后 r ...

  7. memcached 一致性hash原理

    memcache 是一个分布式的缓存系统,但是本身没有提供集群功能,在大型应用的情况下容易成为瓶颈.但是客户端这个时候可以自由扩展,分两阶段实现.第一阶段:key 要先根据一定的算法映射到一台memc ...

  8. 一致性 hash 算法(转)

    add by zhj:介绍了什么是一致性hash,以及实现一致性hash的一种算法. 原文:http://my.oschina.net/u/195065/blog/193614 目录[-] 一致性 h ...

  9. 一致性Hash算法(KetamaHash)的c#实现

    Consistent Hashing最大限度地抑制了hash键的重新分布.另外要取得比较好的负载均衡的效果,往往在服务器数量比较少的时候需要增加虚拟节点来保证服务器能均匀的分布在圆环上.因为使用一般的 ...

随机推荐

  1. JUC知识点总结图

    转载http://www.jsondream.com/2017/06/12/about-JUC.html

  2. 爬虫之mongodb数据库

    一 mongodb的介绍 1.易用性:mongodb是一款强大.灵活并且易扩展的数据库.他面向于文档的数据库,而不是关系性数据库.不采用关系型主要是为了获得更好的扩展性.还有一个好处就是面向文档的数据 ...

  3. js保存,获取,删除cookie的操作

    [转]来自:http://blog.csdn.net/itmyhome1990/article/details/7363816 JSP表单页面 <form action="login& ...

  4. hdu6444 2018中国大学生程序设计竞赛 - 网络选拔赛 1007 Neko's loop

    Neko's loop Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/65536 K (Java/Others) Total S ...

  5. c# 得到list符合某条件的索引值,排序

    请教,在List集合中怎么得到元素的索引值,参考:http://www.myexception.cn/c-sharp/385022.html 这个可以用来读取窗口的多个textbox控件中内容: -- ...

  6. 关于内存类型 UDIMM、RDIMM、LRDIMM 的学习结论(转)

    随着内存技术不断发展,服务器上内存的容量.密度和速度也越来越高.目前在市场上出现的内存条最高密度可以做到每条内存条 4 个 Rank,容量达到 32GB/条,最高速度达到 1.6GHz.高密度高频率也 ...

  7. poj 1094 Sorting It All Out 拓补排序

    Description An ascending sorted sequence of distinct values is one in which some form of a less-than ...

  8. 线程之threading

    多任务:操作系统同时运行多个任务 线程:一个程序运行起来之后一定有一个执行代码的东西,该东西即为线程 线程是操作系统调度执行的最小单位   * 并发:指的是任务数多余cpu核数,通过操作系统的各种任务 ...

  9. Ubuntu安装spyder并添加快捷方式

    Ubuntu安装spyder并添加快捷方式 之前通过 sudo apt install spyder sudo apt install spyder3 安装spyder,但是这样有个坏处,编译器只能用 ...

  10. 20145232 韩文浩 《Java程序设计》第10周学习总结

    13.1 网络概述 13.1.1计算机网络概述 网络编程的实质:两个(或多个)设备(例如计算机)之间的数据传输. 计算机网络的定义:通过一定的物理设备将处于不同位置的计算机连接起来组成的网络,这个网络 ...