分布式系统原理之cap理论
1.1 CAP理论的含义
Cap理论表示在分布式系统中一致性(C)、可用性(A)和分区容错性(P)最多只能同时满足两个。
一致性:客户端更新数据成功后,在任意时刻,在系统任意对外提供服务的节点,读取到的数据都是最新写入的数据。(强一致性)。
可用性:当系统出现异常时,仍能对外提供服务。
分区容错:当出现网络分区时,系统的容错能力(机器之间出现网络故障,不能正常通信)。
证明cap理论:有两台机器M1和M2,为保持一致性,两台机器的数据相同,现在客户端对M1的数据进行更新,但M1和M2之间出现网络故障(分区),M的最新数据无法同步到M2,导致M1的数据变为v1,M2仍为v0。现有一客户端向M2发送数据读取请求,对此请求的处理有两种选择:
- 返回旧数据v0,满足可用性,但是却违反了一致性。
- 阻塞此次读操作,直至网络故障恢复,M1的数据v1同步到M2中,满足一致性,但违反了可用性。
由于分布式系统天生具有分区的特性,所以一定要满足P,只能在CA中选其一。
Cap理论说明了想设计完全满足强一致性、可用性和分区容错性的分布式系统是不切实际的,只能在三者之间权衡,为分布式系统的设计提供理论指导。
1.2 一致性的分类
一致性可从客户端和服务端两个角度来看,客户端一致性定义客户端怎样和何时看到数据更新,服务端一致性定义更新时数据如何流经系统及系统对更新有何保证。
客户端一致性分为以下几种:
1. 强一致性:数据更新之后,任何客户端在后续的访问中都能访问到最新版本的数据。
2. 弱一致性:数据更新之后,不能保证客户端的访问能访问到最新更新之后的数据,数据更新到所有客户端可见这段时间称为不一致窗口。
3. 最终一致性:最终一致性是种特殊的弱一致性,假如更新数据之后没有后续的对此数据对象的更新操作,系统保证一段时间之后任何客户端对此数据对象的访问都能返回最后一次更新的数据。
最终一致性有如下变种:
1. 因果一致性: 如果进程A向进程B传达它已更新数据项,则进程B的后续访问将返回更新的值,并且保证写入将取代先前的写入。进程C的访问与进程A没有因果关系,遵循正常的最终一致性规则。
2. 读已之所写一致性: 进程A在更新数据项之后始终访问更新的值,并且永远不会看到较旧的值。这是因果一致性模型的特例
3. 会话一致性:是读已之所写的实际应用版本,进程对系统的访问存在与一个会话上下文中,在此会话中的访问遵循读已之所写一致性。
4. 单调读一致性:进程访问某一数据对象的值之后,此进程后续的访问都不会返回更旧版本的值。
5. 单调写一致性:系统保证相同进程的一系列写操作是序列化有序的。
同一个系统中,可以同时满足多种一致性,例如读已之所写和单调读一致性是常用的组合方案,这两种一致性使系统更易使用。
服务端一致性:
N=存储数据副本的结点数量
W=在更新完成之前,需要确认更新成功的副本数量。
R=当读操作访问数据对象,需要访问的副本数量
如果W+R>N,写副本和读副本会出现重叠,能保证一定能读到更新后的数据对象,从而保证强一致性。例如:在实现了primary-backup关系数据库管理系统中,同步副本技术N=2,W=2,R=1,能保证强一致性;异步副本方式N=2,W=1,R=1, R+W=N,一致性不能得到保证。
如果W+R<=N, 那么不能保证强一致性,只能是弱一致性或最终一致性。如在主备RDBMS中,使用异步同步副本,并开启从副本读功能的方式,那么N=2, W=1和R=1。在这种情况下,R+W=N, 一致性不能得到保证。
1.3 CAP理论的变种(BASE理论)
BASE理论由CAP理论演化而来,是工业界对分布式系统实践的总结,其核心思想是即使无法达到强一致性,也要保证满足最终一致性。
BASE是Basically Available(基本可用)、Soft state(软状态)和Eventually consistent(最终一致性)三个短语的简写。
基本可用:当系统发生不可预知故障时,允许损失部分可用性,例如:部分机房故障,允许查询时间变长(时间上的损失),系统高峰期为保证系统的稳定性,将部分用户请求引导到降级页面(功能上的损失)。
软状态:允许系统中的数据存在中间状态,该中间状态不会影响系统的整体可用性,即允许多个副本间的同步存在延时。
最终一致性:系统中数据的副本经过一段时间的同步之后,最终能达到一致性状态,不要求强一致性。
参考文献
[1] 分布式系统的CAP理论.https://www.hollischuang.com/archives/666
[2] Vogels W. Eventually consistent[J]. Communications of the ACM, 2009, 52(1): 40-44.
[3] 分布式系统原理九:CAP理论和BASE理论.http://feixiao.github.io/2017/03/14/fbsxt9/
分布式系统原理之cap理论的更多相关文章
- 【Redis数据库】再有人问你CAP理论是什么,就把这篇文章发给他
CAP是Consistency(一致性),Availability(可用性),Partition tolerance(分区容错性)的缩写.在学习redis过程中看到这个名词,查找各位大佬的文章发现这篇 ...
- 如果有人问你CAP理论是什么,就把这篇文章发给他。
绝对和你在网上看到的CAP定理介绍不一样. CAP 定理(CAP theorem)又被称作布鲁尔定理(Brewer's theorem),是加州大学伯克利分校的计算机科学家埃里克·布鲁尔(Eric B ...
- CAP理论中的P到底是个什么意思
在CAP理论中,C代表一致性,A代表可用性(在一定时间内,用户的请求都会得到应答),P代表分区容错.这里分区容错到底是指数据上的多个备份还是说其它的 ? 我感觉分布式系统中,CAP理论应该是C和A存在 ...
- 【D】分布式系统的CAP理论
2000年7月,加州大学伯克利分校的Eric Brewer教授在ACM PODC会议上提出CAP猜想.2年后,麻省理工学院的Seth Gilbert和Nancy Lynch从理论上证明了CAP.之后, ...
- 转载:分布式系统的CAP理论
原文转载Hollis原创文章:http://www.hollischuang.com/archives/666 2000年7月,加州大学伯克利分校的Eric Brewer教授在ACM PODC会议上提 ...
- 分布式系统之CAP理论杂记[转]
分布式系统之CAP理论杂记 http://www.cnblogs.com/highriver/archive/2011/09/15/2176833.html 分布式系统的CAP理论: 理论首先把分布式 ...
- 分布式系统之CAP理论
任老师第一节主要讲了分布式系统实现时候面临的八个问题,布置的作业就是这个,查询CAP理论. 笔者初次接触分布式,所以本文主要是一个汇总. 一.CAP起源 CAP原本是一个猜想,2000年PODC大会的 ...
- 分布式系统之CAP理论杂记
分布式系统的CAP理论:理论首先把分布式系统中的三个特性进行了如下归纳:● 一致性(C):在分布式系统中的所有数据备份,在同一时刻是否同样的值.● 可用性(A):在集群中一部分节点故障后,集群整体是否 ...
- 分布式系统CAP理论
在单机的数据库系统之中,我们很容易实现一套满足ACID 特性的 事务处理系统, 事务的一致性不存在问题. 但是在分布式系统之中,由于数据分布在不同的主机结点上,如何对着些数据进行分布式的事务处理就具有 ...
随机推荐
- BZOJ练习记
决定从头到尾干一波BZOJ!可能会写没几题就停下吧,但还是想学学新姿势啦. 1001. [BeiJing2006]狼抓兔子 即求 $(1, 1)$ 到 $(n, m)$ 的最小割.跑 dinic 即可 ...
- 阿里云重置CentOS的root默认密码
问题 今天使用阿里云开了一个云服务器,系统为 CentOS ,远程连接登录时不知道默认root密码 解决方法 在 控制台-实例-操作 中选择 更多-密码/秘钥-重置实例密码 即可
- 为什么accpet会重新返回一个套接字
在服务器端,socket()返回的套接字用于监听(listen)和接受(accept)客户端的连接请求.这个套接字不能用于与客户端之间发送和接收数据. accept()接受一个客户端的连接请求,并返回 ...
- Codeforces Round #530 (Div. 2) F 线段树 + 树形dp(自下往上)
https://codeforces.com/contest/1099/problem/F 题意 一颗n个节点的树上,每个点都有\(x[i]\)个饼干,然后在i节点上吃一个饼干的时间是\(t[i]\) ...
- [LeetCode] 834. Sum of Distances in Tree 树中距离之和
An undirected, connected tree with N nodes labelled 0...N-1 and N-1 edges are given. The ith edge co ...
- java包学习之IO
第一 java IO的专题 第二 编码 1.从桌面创建内容为“联”的txt,打开为乱码开始讲起,原因是我们的电脑默认是创建ansi编码的,但是“联”字比较特别,编码会被认为是utf-8的,所以会出现乱 ...
- 2 datax mysql 和 mysql之间相互导入
插件文档: https://github.com/alibaba/DataX/blob/master/hdfswriter/doc/hdfswriter.md 1,参照第1篇日记,安装好datax ...
- c# 在DataTable的第一列(指定列)的前面添加一列
c# 在DataTable的第一列(指定列)的前面添加一列 dt.Columns.Add("ID").SetOrdinal(0)
- Linux命令随手记
随手记录常用的Linux命令. tar 解压. tar -xzvf tar 压缩:tar -czvf .tgz (z是压缩格式,x为解压,v为显示过程,f指定备份文件) tar -zc ...
- 如何将vscode的终端放到右侧
这个问题我之前上百度搜了一下,只有百度经验有, 但是百度经验的图片看不清,而且按照百度经验的回答,我找不到它说的用户设置 于是我问了一下同学,很简单. 右击终端那条框,我们可以得到下面这张截图 点击将 ...