阿里云分布式缓存OCS与DB之间的数据一致性

【分布式系统的数据一致性问题】

OCS概要介绍

据AlertSite网络分析公司表示，Facebook的响应时间在2010年平均为1秒钟，到2011年中期已提高到了0.73秒。对比来看，响应时间占第二位的LinkedIn，网络下载内容时要花费将近2倍的时间。Twitter的响应时间则整整迟了2秒钟。响应时间优化的首要手段就是采用缓存技术，减少系统间交互请求和磁盘IO。

OCS是阿里巴巴集团的分布式缓存产品，支撑着淘宝、阿里巴巴、支付宝的日常运作，尤其在双11等大型活动上，承载了绝大多数的数据请求。与OCS相比，著名的Memcached具备了分布式集群管理的功能。2014年OCS经历了从分布式到云服务的进化，作为阿里云服务的缓存产品正式商业化。

OCS技术讲解

OCS的核心存储是淘宝的开源产品TAIR（发音：太爱儿）

TAIR原理

角色上分为DataServer，ConfigServer：

ConfigServer负责数据的路由表管理，决定着哪些数据应该去哪里访问。同时也管理着DataServer节点的存活状态，自动踢出宕机或者异常节点。
DataServer是数据存储节点，负责数据的增删改查。通过Plugin机制支持多种存储引擎。常用的有基于内存的，所有的数据保存在内存之中，查询速度快，但不持久化，网络正常的情况下，客户端在0.2ms内得到请求响应。另外一种常用存储引擎基于SSD介质再依靠内存加速，特点是容量大，成本低，性能上接近内存引擎，客户端请求响应时间大概是1ms。

集群初始化时ConfigServer会根据DataServer的数量分配BucketID到DataServer上，这层映射关系就是数据路由索引，BucketID属于[0-1023]的范围内。客户端第一次启动时会从ConfigServer上拉取映射关系，之后的读写请求，根据全局约定的Hash算法(例如MurmurHash(key)24)计算出BucketID，根据映射关系描述向指定的DataServer上发送请求。

ConfigServer上的路由信息会根据DataServer存活状况动态修改更新；新结果再告知给DataServer；当DataServer处理客户端响应时，将变更通知给客户端。

图1 路由路径

从TAIR到OCS

云服务化的过程中，首要问题是满足用户的兼容性需求，用户访问接口上支持广泛流行的Memcached接口，原生于Memcached的应用，可以无缝迁移到OCS上来。

其次是稳定性，集群升级时，由于进程重启会造成应用请求OCS瞬间报错，OCS实现了一套热升级方案，在保持TCP链接不中断的情况下重启进程。

云服务还有一个重要特性就是多租户，多租户的情况下，为了防止某一两个用户的高并发访问造成集群负载上升，从而影响了其他租户的稳定性。OCS内部对不同的租户进行了资源隔离，针对请求量、带宽、内存使用量做了严格的限制。不同规格的用户可以购买不同规格的OCS实例，之间不会互相干扰。

与OCS相比，自建的Memcached解决了单机容量上线问题，实现扩容自动化且不需要修改客户端配置，同时输出了性能监控指标，网页版Console命令等。

缓存失效一致性问题

一般缓存的使用方式是：先读取缓存，若不存在则从DB中读取，并将结果写入到缓存中；下次数据读取时便可以直接从缓存中获取数据。

数据的修改是直接失效缓存数据，再修改DB内容，避免DB修改成功，但由于网络或者其他问题导致缓存数据没有清理，造成了脏数据。

但这样仍然无法避免脏数据的产生，一种并发的场景下：假设业务对数据Key:Hello Value:World有大量的读取和修改请求。线程A向OCS读取Key:Hello，得到Not Found结果，开始向DB请求数据，得到数据Key:Hello Value:World；接下来准备向OCS写入此条数据，但在写入OCS前（网络，CPU都等可能导致A线程处理速度降低）另一B线程请求修改数据Key:Hello Value:OCS，首先执行失效缓存动作（因为B线程并不知道是否有此条数据，因此直接执行失效操作），OCS成功处理了失效请求。转回到A线程继续执行写入OCS，将Key:Hello Value:World写入到缓存中，A线程任务结束；B线程也成功修改了DB数据内容为Key:Hello Value:OCS。

图2 并发时序

此时OCS中的数据为Key:Hello Value:World；DB中的数据为Key:Hello Value:OCS，出现缓存脏数据！

为了解决这个问题，OCS扩充了Memcached协议（公有云即将支持），增加了deleteAndIncVersion接口。此接口并不会真的删除数据，而是给数据打了标签，表明已失效状态，并且增加数据版本号；如果数据不存在则写入NULL，同时也生成随机数据版本号。OCS写入支持原子对比版本号：假设传入的版本号与OCS保存的数据版本号一致或者原数据不存在，则准许写入，否则拒绝修改。

回到刚才的场景上：线程A向OCS读取Key:Hello，得到Not Found结果，开始向DB请求数据，得到数据Key:Hello Value:World；接下来准备向OCS写入此条数据，版本号信息默认为1；在A写入OCS前另一个B线程发起了动作修改数据Key:Hello Value:OCS，首先执行删除缓存动作，OCS顺利处理了deleteAndIncVersion请求，生成了随机版本号12345（约定大于1000）。转回到A线程继续执行写入OCS，请求将Key:Hello Value:World写入，此时缓存系统发现传入的版本号信息不匹配（1 ！＝ 12345），写入失败，A线程任务结束；B线程也成功修改了DB数据内容为Key:Hello Value:OCS。

此时OCS中的数据为Key:Hello Value:NULL Version:12345；DB中的数据为Key:Hello Value:OCS，后续读任务时会再次尝试将DB中的数据写入到OCS中。

类似的并发场景还有很多，读者可以自行推演，同时也可以思考下为何约定随机生成的版本要大于1000？

缓存数据的同步的一致性问题

随着网站规模增长和可靠性的提升，会面临多IDC的部署，每个IDC都有一套独立的DB和缓存系统，这时缓存一致性又成了突出的问题。

首先缓存系统为了保证高效率，会杜绝磁盘IO，哪怕是写BINLOG；当然缓存系统为了性能可以只同步删除，不同步写入，那么缓存的同步一般会优先于DB同步到达（毕竟缓存系统的效率要高得多），那么就会出现缓存中无数据，DB中是旧数据的场景。此时，有业务请求数据，读取缓存Not Found，从DB读取并加载到缓存中的仍然是旧数据，DB数据同步到达时也只更新了DB，缓存脏数据无法被清除。

图3 并发时序

从上面的情况可以看出，不一致的根本原因是异构系统之间无法协同同步，不能保证DB数据先同步，缓存数据后同步。所以就要考虑缓存系统如何等待DB同步，或者能否做到两者共用一套同步机制？缓存同步也依赖DB BINLOG是一个可行的方案。

IDC1中的DB，通过BINLOG同步给IDC2中的DB，此时IDC2-DB数据修改也会产生自身的BINLOG，缓存的数据同步就可以通过IDC2-DB BINLOG进行。缓存同步模块分析BINLOG后，失效相应的缓存Key，同步从并行改为串行，保证了先后顺序。

这样，IDC间的数据同步架构更加简单清晰，系统服用率高，做好BINLOG同步和抓取即可。

图4 异地同步

总结

不同系统之间的数据同步一直是一个世界性的问题，目前仍然没有方法解除CAP魔咒，只能根据实际的情况在三者之间寻找理想的平衡点。本文介绍的解决方案，其一是利用了缓存系统的原子操作，其二是利用了外部系统同步机制保证先后，都是在牺牲最小的性能代价时获取最大的一致性保证，但仍然无法覆盖全部场景下的一致性问题。

阿里云分布式缓存OCS与DB之间的数据一致性的更多相关文章

华为云分布式缓存服务DCS与开源服务差异对比
华为云分布式缓存DCS提供单机.主备.集群等丰富的实例类型,满足用户高读写性能及快速数据访问的业务诉求.支持丰富的实例管理操作,帮助用户省去运维烦恼.用户可以聚焦于业务逻辑本身,而无需过多考虑部署.监 ...
.net core 使用阿里云分布式日志
前言好久没有出来夸白了,今天教大家简单的使用阿里云分布式日志,来存储日志,没有阿里云账号的,可以免费注册一个开通阿里云分布式日志(有一定的免费额度,个人测试学习完全没问题的,香) 阿里云日志地址: ...
云计算之路-阿里云上：OCS问题的进展以及11:30-11:50遇到的问题
(上图是今天出问题期间Web服务器性能监控图,紫色表示的是Request Execution Time) 昨天我们发布了一篇博客分享了我们这两天遇到的OCS(开放缓存服务)问题,详见云计算之路-阿里云 ...
云计算之路-阿里云上：13:43-13:44之间RDS故障影响了全站的正常访问
抱歉!13:43-13:44之间,由于阿里云RDS(云数据库)出现2分钟突发故障,影响了全站的正常访问,给大家带来了麻烦,望大家谅解! 故障期间,应用程序日志中记录的错误信息如下: System.Da ...
阿里云RDS实例内不同数据库之间的数据迁移
适用场景本文适用于使用DTS实现相同实例下库名不同的数据库之间的数据迁移.本文以使用DTS将同一RDS实例下的amptest库迁移到jiangliu_amptest库为例来说明如何使用DTS实现相同 ...
阿里云分布式关系数据库DRDS笔记
1.Join左边的表查询数据越少,性能越好 2.广播表作为Join的驱动表 3.SQL的Limit优化 SELECT * FROM t_order o WHERE o.id IN ( SELECT i ...
阿里云数据库实例的一个db被开发人员删除了如何恢复
1没有逻辑备份的话. 如下操作即可可以将那个临时实例的需要导的db用逻辑备份出来恢复到主实例就行了好多朋友都在问,RDS中把数据恢复到7天内任意时间点的功能在哪里啊? 其实挺简单的,只需要五步操 ...
阿里云cdn缓存设置技巧，不同文件结尾用不同的缓存时间
https://edu.aliyun.com/lesson_130_1505?spm=5176.10731542.0.0.2ed37dbf42YL6U#_1505
云计算之路-阿里云上：用上了开放缓存服务OCS
你知道在我们使用的云服务器中哪台最贵吗?跑memcached的缓存服务器(12G内存).你知道保证网站访问速度的功臣之一是谁吗?跑memcached的缓存服务器. 用云服务器这么高贵的内存跑memca ...

随机推荐

api xml database 设计一种数据库
w 问题 0-新增和读取,可以忽略更新和删除: 1-被请求方的xml dom结构多层且不定,且未来可能增删某些键(dom节点),且键值长度最值可能无法确定: 3-请求过程可能出现异常exception ...
Time-series Storage Layer Time Series Databases 时间序列
w 关于时间序列数据库的思考-CSDN.NET http://www.csdn.net/article/2015-07-13/2825192 存储和处理时间序列数据(“Time Series Da ...
python系列一：python3基础语法
'''python保留字即关键字,我们不能把它们用作任何标识符名称.Python 的标准库提供了一个 keyword 模块,可以输出当前版本的所有关键字: '''>>> import ...
velocity 的 escape实现
EscapeHtmlReference的escape方法调用以下方法实现: StringEscapeUtils.escapeHtml(param); 再调用 org.apache.commons.la ...
VMware下安装CentOS
开始安装VMware 下载CentOS 7.4 镜像可以去阿里云的镜像站下载:https://opsx.alibaba.com/mirror 来到主页面,点击centos 选择 7.4 版本选择镜 ...
linux环回文件
我们通常在设备上(比如磁盘分区)上创建文件系统,这些存储设备能够以设备文件的形式来使用,如/dev/device_name.为了使用存储设备上的文件系统,我们将其挂载到挂载点. 环回文件系统是指那些在 ...
XSS - 禁止浏览器读取Cookie - HttpOnly
1.什么是HttpOnly? 如果您在cookie中设置了HttpOnly属性,那么通过js脚本将无法读取到cookie信息,这样能有效的防止XSS攻击,具体一点的介绍请google进行搜索. C ...
Spring:笔记整理(1)——HelloWorld
Spring:笔记整理(1)——HelloWorld 导入JAR包: 核心Jar包 Jar包解释 Spring-core 这个jar 文件包含Spring 框架基本的核心工具类.Spring 其它组件 ...
[MVC学习日记]2014/12/01 初步认识MVC模型。
2014/12/011.初步认识MVC模型.MVC模式是一种表现模式.它将web应用程序分成三个部分,模型(Model).视图(View).控制器(Controller).Model:是实现业务逻辑层 ...
给二维码（图片）添加文字（水印），让生成的二维码中间带logo
<?php //生成二维码 require_once IA_ROOT . '/framework/library/qrcode/phpqrcode.php'; QRcode::png($url, ...

阿里云分布式缓存OCS与DB之间的数据一致性

阿里云分布式缓存OCS与DB之间的数据一致性的更多相关文章

随机推荐

热门专题