关于一致性hash,这可能是全网最形象生动最容易理解的文档,想做架构师的你来了解一下
问题提出
一致性hash是什么?假设有4台缓存服务器N0,N1,N2,N3
,现在需要存储数据OBJECT1,OBJECT2,OBJECT3,OBJECT4,OBJECT5,OBJECT5,OBJECT7,OBJECT8
,
我们需要将这些数据缓存到这4台服务器上,相应的问题是
如何设计数据存放策略?即ObjectX 应该存放在哪台服务器上?
为了解决这个问题,我们有如下几个思路。
1. 余数hash方案
采用hash(Objectx)%4来确定服务器节点
假设 hash(OBJECT1)=2
,由 2%4=2,可知,Object1
则应该存放到节点N2
上
假设 hash(OBJECT2)=3
,由 3%4=3,可知,Object2
则应该存放到节点N3
上
假设 hash(OBJECT3)=1
,由 1%4=1,可知,Object3
则应该存放到节点N1
上
假设 hash(OBJECT4)=0
,由 1%4=1,可知,Object4
则应该存放到节点N0
上
假设 hash(OBJECT5)=5
,由 5%4=1,可知,Object5
则应该存放到节点N1
上
假设 hash(OBJECT6)=6
,由 6%4=2,可知,Object6
则应该存放到节点N2
上
假设 hash(OBJECT7)=7
,由 7%4=3,可知,Object7
则应该存放到节点N3
上
假设 hash(OBJECT8)=8
,由 8%4=0,可知,Object8
则应该存放到节点N0
上
假设我们需要读取Object3
的数据,则由hash(object3)=1
可知,我们只需要访问节点N1
即可。
1.1 现在假设N3
忽然故障下线
我们面临缓存重新构造的问题
采用hash(Objectx)%3来确定服务器节点
假设 hash(OBJECT1)=2
,由 2%3=2,可知,Object1
则应该存放到节点N2
上
假设 hash(OBJECT2)=3
,由 3%3=0,可知,Object2
则应该存放到节点N0
上
假设 hash(OBJECT3)=1
,由 1%3=1,可知,Object3
则应该存放到节点N1
上
假设 hash(OBJECT4)=0
,由 0%3=0,可知,Object4
则应该存放到节点N0
上
假设 hash(OBJECT5)=5
,由 5%3=2,可知,Object5
则应该存放到节点N2
上
假设 hash(OBJECT6)=6
,由 6%3=0,可知,Object6
则应该存放到节点N0
上
假设 hash(OBJECT7)=7
,由 7%3=1,可知,Object7
则应该存放到节点N1
上
假设 hash(OBJECT8)=8
,由 8%3=2,可知,Object8
则应该存放到节点N2
上
此时为了保证数据的准确性,我们需要
将数据Object2
从N3
迁移到N0
将数据Object5
从N1
迁移到N2
将数据Object6
从N2
迁移到N0
将数据Object7
从N3
迁移到N1
将数据Object8
从N0
迁移到N2
1.2 现在假设我们添加一台新的服务器N4
我们面临缓存重新构造的问题
采用hash(Objectx)%5来确定服务器节点
假设 hash(OBJECT1)=2
,由 2%5=2,可知,Object1
则应该存放到节点N2
上
假设 hash(OBJECT2)=3
,由 3%5=3,可知,Object2
则应该存放到节点N3
上
假设 hash(OBJECT3)=1
,由 1%5=1,可知,Object3
则应该存放到节点N1
上
假设 hash(OBJECT4)=0
,由 0%5=0,可知,Object4
则应该存放到节点N0
上
假设 hash(OBJECT5)=5
,由 5%5=0,可知,Object5
则应该存放到节点N0
上
假设 hash(OBJECT6)=6
,由 6%5=1,可知,Object6
则应该存放到节点N1
上
假设 hash(OBJECT7)=7
,由 7%5=2,可知,Object7
则应该存放到节点N2
上
假设 hash(OBJECT8)=8
,由 8%5=3,可知,Object8
则应该存放到节点N3
上
此时为了保证数据的准确性,我们需要
将数据Object2
从N3
迁移到N0
将数据Object5
从N1
迁移到N0
将数据Object6
从N2
迁移到N1
将数据Object7
从N3
迁移到N2
将数据Object8
从N0
迁移到N3
从上述俩种情况可以看出,一旦机器数目变化,我们面临大量的缓存变化问题,换言之,缓存大部分失效,很可能会导致雪崩。
2.一致性hash方案
现在我们更换如下策略
0<hash(Objectx)%8<=2 ,则存放在
N0
2<hash(Objectx)%8<=4 ,则存放在N1
4<hash(Objectx)%8<=6 ,则存放在N2
6<hash(Objectx)%8<=8 ,则存放在N3
2.1 现在假设N3
忽然故障下线
我们面临缓存重新构造的问题,调整策略如下
0<hash(Objectx)%8<=2 ,则存放在
N0
2<hash(Objectx)%8<=4 ,则存放在N1
4<hash(Objectx)%8<=6 ,则存放在N2
6<hash(Objectx)%8<=8 ,则存放在N0
此时为了保证数据的准确性,我们需要
将数据ObjectX
从N3
迁移到N0
,受影响的数据仅仅N3相关的数据。
2.2 现在假设我们添加一台新的服务器N4
我们面临缓存重新构造的问题,调整策略如下
0<hash(Objectx)%8<=2 ,则存放在
N0
2<hash(Objectx)%8<=4 ,则存放在N1
4<hash(Objectx)%8<=5 ,则存放在N2
5<hash(Objectx)%8<=6 ,则存放在N4
6<hash(Objectx)%8<=8 ,则存放在N3
此时为了保证数据的准确性,我们需要
将数据从N2
复制到N4
,受影响的仅仅N2相关的用户。
比较上述俩种做法,可见方案2更优. 方案2就是一致性hash
2.3 缺点
机器越少,则每台机器上负载将越不均匀,解决这个问题的方法是添加虚拟节点,调整策略,如下,可以想象,数据越多,分布越均匀。
0<hash(Objectx)%8<=1 ,则存放在
N0
1<hash(Objectx)%8<=2 ,则存放在N1
2<hash(Objectx)%8<=3 ,则存放在N2
3<hash(Objectx)%8<=4 ,则存放在N3
4<hash(Objectx)%8<=5 ,则存放在N0
5<hash(Objectx)%8<=6 ,则存放在N1
6<hash(Objectx)%8<=7 ,则存放在N2
7<hash(Objectx)%8<=8 ,则存放在N3
3. 一致性Hash原理
原理网络上太多,这里不做进一步阐述。
推荐阅读
开源项目golang go语言后台管理框架restgo-admin
推荐阅读
开源项目golang go语言后台管理框架restgo-admin
关于一致性hash,这可能是全网最形象生动最容易理解的文档,想做架构师的你来了解一下的更多相关文章
- 对一致性Hash算法,Java代码实现的深入研究
一致性Hash算法 关于一致性Hash算法,在我之前的博文中已经有多次提到了,MemCache超详细解读一文中"一致性Hash算法"部分,对于为什么要使用一致性Hash算法.一致性 ...
- 转载自lanceyan: 一致性hash和solr千万级数据分布式搜索引擎中的应用
一致性hash和solr千万级数据分布式搜索引擎中的应用 互联网创业中大部分人都是草根创业,这个时候没有强劲的服务器,也没有钱去买很昂贵的海量数据库.在这样严峻的条件下,一批又一批的创业者从创业中获得 ...
- 一致性hash算法详解
转载请说明出处:http://blog.csdn.net/cywosp/article/details/23397179 一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT) ...
- 探索c#之一致性Hash详解
阅读目录: 使用场景 算法原理 虚拟节点 代码示例 使用场景 以Redis为例,当系统需要缓存的内容超过单机内存大小时,例如要缓存100G数据,单机内存仅有16G时.这时候就需要考虑进行缓存数据分片, ...
- 一致性hash算法简介
一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT)实现算法,设计目标是为了解决因特网中的热点(Hot spot)问题,初衷和CARP十分类似.一致性哈希修正了CARP使用的简单哈希 ...
- 分布式缓存技术memcached学习(四)—— 一致性hash算法原理
分布式一致性hash算法简介 当你看到“分布式一致性hash算法”这个词时,第一时间可能会问,什么是分布式,什么是一致性,hash又是什么.在分析分布式一致性hash算法原理之前,我们先来了解一下这几 ...
- 关于Memcached一致性hash的探究
参考文章 http://blog.chinaunix.net/uid-20498361-id-4303232.html http://blog.csdn.net/kongqz/article/deta ...
- 一致性 hash 算法( consistent hashing )a
一致性 hash 算法( consistent hashing ) 张亮 consistent hashing 算法早在 1997 年就在论文 Consistent hashing and rando ...
- Ceph剖析:数据分布之CRUSH算法与一致性Hash
作者:吴香伟 发表于 2014/09/05 版权声明:可以任意转载,转载时务必以超链接形式标明文章原始出处和作者信息以及版权声明 数据分布是分布式存储系统的一个重要部分,数据分布算法至少要考虑以下三个 ...
随机推荐
- EF core 性能调优
Entity Framework Core performance tuning – a worked example Last Updated: February 25, 2019 | Create ...
- ACM数据结构-树状数组
模板: int n; int tree[LEN]; int lowbit(int x){ return x&-x; } void update(int i,int d){//index,del ...
- [Cqoi2016]K远点对 K-Dtree
4520: [Cqoi2016]K远点对 链接 bzoj 思路 用K-Dtree求点的最远距离. 求的时候顺便维护一个大小为2k的小根堆. 不知道为啥一定会对. 代码 #include <bit ...
- 实现mysql的读写分离(mysql-proxy)____1(mysql的主从复制,基于gtid的主从复制,半同步复制,组复制)
主从复制原理: 从库生成两个线程,一个I/O线程,一个SQL线程: i/o线程去请求主库 的binlog,并将得到的binlog日志写到relay log(中继日志) 文件中:主库会生成一个 log ...
- 写一个eggjs权限验证中间件
关于中间件 https://eggjs.org/zh-cn/basics/middleware.html 官方文档说的很清楚了,不再叙述. 我们要达到怎么样一个效果? 用户没有登录不能访问一些特定的页 ...
- Unity制作出《超级马里奥》的2D和3D混合效果
现在来做点别的东西.Nintendo Switch上刚推出的<超级马里奥>中,有一些关卡混合了2D和3D的画面,这种效果十分让人印象深刻.如何在Unity中实现这个效果呢? 正常情况下,摄 ...
- easyui datagrid合并相同数据的单元格。
/** * 根据作用域填充单元格 */ function mergeCellsByField(tableID, colList) { var ColArray = colList.split(&quo ...
- jetty源码下载
jetty下载地址:https://www.eclipse.org/jetty/download.html Release 9.4.20.v20190813 .zip .tgz api ...
- PCL中outofcore模块---基于核外八叉树的大规模点云的显示
写在前面 最近公众号的活动让更多的人加入交流群,尝试提问更多的我问题,群主也在积极的招募更多的小伙伴与我一起分享,能够相互促进. 这里总结群友经常问,经常提的两个问题,并给出我的回答: (1) ...
- shell中的shift左移参数命令
shift命令用于对参数的向左移动,通常用于在不知道传入参数个数的情况下依次遍历每个参数,然后进行相应的处理(常见与Linux中各种程序的启动脚本).在扫描处理脚本程序的参数时,经常要用到shift命 ...