闲话缓存：ZFS 读缓存深入研究-ARC（一）

在Solaris ZFS 中实现的ARC(Adjustable Replacement Cache)读缓存淘汰算法真是很有意义的一块软件代码。它是基于IBM的Megiddo和Modha提出的ARC（Adaptive Replacement Cache）淘汰算法演化而来的。但是ZFS的开发者们对IBM 的ARC算法做了一些扩展，以更适用于ZFS的应用场景。ZFS ARC的最早实现展现在FAST 2003的会议上，并在杂志《;Login:》的一篇文章中被详细描述。

注：关于杂志《；Login:》，可参考这个链接：https://www.usenix.org/publications/login/2003-08/index.html

ZFS ARC真是一个优美的设计。在接下来的描述中，我将尽量简化一些机制，以便于大家更容易理解ZFS ARC的工作原理。关于ZFS ARC的权威描述，可以参考这个链接：http://src.opensolaris.org/source/xref/onnv/onnv-gate/usr/src/uts/common/fs/zfs/arc.c。在接下来的段落中，我将试着给大家深入讲解一下ZFS 读缓存的内部工作原理。我将关注点放在数据如何进入缓存，缓存如何调整它自己以适应I/O模式的变化，以及“Adjustable Replacement Cache”这个名字是如何来的。

缓存

嗯,在一些文件系统缓存中实现的标准的LRU淘汰算法是有一些缺点的。例如，它们对扫描读模式是没有抵抗性的。但你一次顺序读取大量的数据块时，这些数据块就会填满整个缓存空间，即使它们只是被读一次。当缓存空间满了之后，你如果想向缓存放入新的数据，那些最近最少被使用的页面将会被淘汰出去。在这种大量顺序读的情况下，我们的缓存将会只包含这些新读的数据，而不是那些真正被经常使用的数据。在这些顺序读出的数据仅仅只被使用一次的情况下，从缓存的角度来看，它将被这些无用的数据填满。

另外一个挑战是：一个缓存可以根据时间进行优化（缓存那些最近使用的页面），也可以根据频率进行优化（缓存那些最频繁使用的页面）。但是这两种方法都不能适应所有的workload。而一个好的缓存设计是能自动根据workload来调整它的优化策略。

ARC的内部工作原理

在ARC原始的实现（IBM的实现）和ZFS中的扩展实现都解决了这些挑战，或者说现存问题。我将描述由Megiddo和Modha提出的Adaptive Replacement Cache的一些基本概念，ZFS的实现版本作为这个实现机制的一个扩展来介绍。这两种实现（原始的Adaptive Replacement Cache和ZFS Adjustable Replacement Cache）共享一些基本的操作原理，所以我认为这种简化是一种用来解释ZFS ARC切实可行的途径。

首先，假设我们的缓存中有一个固定的页面数量。简单起见，假设我们有一个8个页面大小的缓存。为了是ARC可以工作，在缓存中，它需要一个2倍大小的管理表。

这个管理表分成4个链表。头两个链表是显而易见的：

· 最近最多使用的页面链表（LRU list）

· 最近最频繁使用的页面链表（LFU list）

另外两个链表在它们的角色上有些奇怪。它们被称作ghost链表。那些最近被淘汰出去的页面信息被存储在这两个链表中：

· 存储那些最近从最近最多使用链表中淘汰的页面信息（Ghost list for LRU）

· 存储那些最近从最近最频繁使用链表中淘汰的页面信息（Ghost list for LFU）

这两个ghost链表不储存数据（仅仅储存页面信息，比如offset，dev-id），但是在它们之中的命中对ARC缓存工作的行为具有重要的影响，我将在后面介绍。那么在缓存中都发生了什么呢？

假设我们从磁盘上读取一个页面，并把它放入cache中。这个页面会放入LRU 链表中。

接下来我们读取另外一个不同的页面。它也会被放入缓存。显然，他也会被放入LRU 链表的最近最多使用的位置（位置1）：

好，现在我们再读一次第一个页面。我们可以看到，这个页面在缓存中将会被移到LFU链表中。所有进入LRU链表中的页面都必须至少被访问两次。无论什么时候，一个已经在LFU链表中的页面被再次访问，它都会被放到LFU链表的开始位置（most frequently used）。这么做，那些真正被频繁访问的页面将永远呆在缓存中，不经常访问的页面会向链表尾部移动，最终被淘汰出去。

随着时间的推移，这两个链表不断的被填充，缓存也相应的被填充。这时，缓存已经满了，而你读进了一个没有被缓存的页面。所以，我们必须从缓存中淘汰一个页面，为这个新的数据页提供位置。这个数据页可能刚刚才被从缓存中淘汰出去，也就是说它不被缓存中任何的非ghost链表引用着。

假设LRU链表已经满了：

这时在LRU链表中，最近最少使用的页面将会被淘汰出去。这个页面的信息会被放进LRU ghost链表中。

现在这个被淘汰的页面不再被缓存引用，所以我们可以把这个数据页的数据释放掉。新的数据页将会被缓存表引用。

随着更多的页面被淘汰，这个在LRU ghost中的页面信息也会向ghost链表尾部移动。在随后的一个时间点，这个被淘汰页面的信息也会到达链表尾部，LRU链表的下一次的淘汰过程发生之后，这个页面信息也会从LRU ghost链表中移除，那是就再也没有任何对它的引用了。

好的，如果这个页面在被从LRU ghost链表中移除之前，被再一次访问了，将会发生什么？这样的一个读将会引起一次幽灵（phantom）命中。由于这个页面的数据已经从缓存中移除了，所以系统还是必须从后端存储媒介中再读一次，但是由于这个幽灵命中，系统知道，这是一个刚刚淘汰的页面，而不是第一次读取或者说很久之前读取的一个页面。ARC用这个信息来调整它自己，以适应当前的I/O模式（workload）。

很显然，这个迹象说明我们的LRU缓存太小了。在这种情况下，LRU链表的长度将会被增加一。显然，LFU链表的长度将会被减一。

但是同样的机制存在于LFU这边。如果一次命中发生在LFU ghost 链表中，它会减少LRU链表的长度（减一），以此在LFU 链表中加一个可用空间。

利用这种行为，ARC使它自己自适应于工作负载。如果工作负载趋向于访问最近访问过的文件，将会有更多的命中发生在LRU Ghost链表中，也就是说这样会增加LRU的缓存空间。反过来一样，如果工作负载趋向于访问最近频繁访问的文件，更多的命中将会发生在LFU Ghost链表中，这样LFU的缓存空间将会增大。

进一步，这种行为开启了一个灵活的特性：假设你为处理log文件而读取了大量的文件。你只需要每个文件一次。一个LRU 缓存将会把所有的数据缓存住，这样也就把经常访问的数据也淘汰出去了。但是由于你仅仅访问这些文件一次，它们不会为你带来任何价值一旦它们填满了缓存。

一个ARC缓存的行为是不同的。显然这样的工作负载仅仅会很快填满LRU链表空间，而这些页面很快就会被淘汰出去。但是由于每个这样的页面仅仅被访问一次，它们基本不太可能在为最近访问的文件而设计的ghost链表中命中。这样，LRU的缓存空间不会因为这些仅读一次的页面而增加。

假如你把这些log文件与一个大的数据块联系在一起（为了简单起见，我们假设这个数据块没有自己的缓存机制）。数据文件中的数据页应该会被频繁的访问。被LFU ghost链表引用的正在被访问的页面就很有可能大大的高于LRU ghost链表。这样，经常被访问的数据库页面的缓存空间就会增加。最终，我们的缓存机制就会向缓存数据块页面优化，而不是用log文件来污染我们的缓存空间。

闲话缓存：ZFS 读缓存深入研究-ARC（一）的更多相关文章

闲话缓存：ZFS 读缓存深入研究-ARC（二）
Solaris ZFS ARC的改动(相对于IBM ARC) 如我前面所说,ZFS实现的ARC和IBM提出的ARC淘汰算法并不是完全一致的.在某些方面,它做了一些扩展: · ZFS A ...
使用Retrofit和Okhttp实现网络缓存。无网读缓存，有网根据过期时间重新请求（转）
使用Retrofit和Okhttp实现网络缓存,更新于2016.02.02原文链接:http://www.jianshu.com/p/9c3b4ea108a7 本文使用 Retrofit2.0.0-b ...
TimesTen 应用层数据库缓存学习：4. 仅仅读缓存
在运行本文样例前.首先先运行TimesTen 应用层数据库缓存学习:2. 环境准备中的操作. Read-only Cache Group的概念仅仅读缓存组例如以下图: 仅仅读缓存组(Read-Onl ...
优化MySQL，还是使用缓存？读一篇文章有感
今天我想对一个Greenfield项目上可以采用的各种性能优化策略作个对比.换言之,该项目没有之前决策强加给它的各种约束限制,也还没有被优化过. 具体来说,我想比较的两种优化策略是优化MySQL和缓存 ...
【转】图片缓存之内存缓存技术LruCache、软引用比较
每当碰到一些大图片的时候,我们如果不对图片进行处理就会报OOM异常,这个问题曾经让我觉得很烦恼,后来终于得到了解决,那么现在就让我和大家一起分享一下吧.这篇博文要讲的图片缓存机制,我接触到的有两钟,一 ...
Redis缓存雪崩，缓存穿透，热点key解决方案和分析
缓存穿透缓存系统,按照KEY去查询VALUE,当KEY对应的VALUE一定不存在的时候并对KEY并发请求量很大的时候,就会对后端造成很大的压力. (查询一个必然不存在的数据.比如文章表,查询一个不存 ...
Hibernatne 缓存中二级缓存简单介绍
hibernate的session提供了一级缓存,每个session,对同一个id进行两次load,不会发送两条sql给数据库,但是session关闭的时候,一级缓存就失效了. 二级缓存是Sessio ...
一级缓存、二级缓存、延迟加载、hibernate session 域 pojo三种状态
1.一级缓存(session缓存 ).二级缓存意义:提高hibernate查询效率. 缺点:可能会因并发,产生数据不一致. 本质:基于session 的缓存,利用hiber ...
[原创]java WEB学习笔记93：Hibernate学习之路---Hibernate 缓存介绍，缓存级别，使用二级缓存的情况，二级缓存的架构集合缓存，二级缓存的并发策略，实现步骤，集合缓存，查询缓存，时间戳缓存
本博客的目的:①总结自己的学习过程,相当于学习笔记 ②将自己的经验分享给大家,相互学习,互相交流,不可商用内容难免出现问题,欢迎指正,交流,探讨,可以留言,也可以通过以下方式联系. 本人互联网技术爱 ...

随机推荐

通用CSS命名规范
一．文件命名规范样式文件命名主要的 master.css布局,版面 layout.css专栏 columns.css文字 font.css打印样式 print.css主题 themes.css [/ ...
java io简单使用
public class CreateFile { public static void main(String[] args) { /* * 文件夹的创建和文件的生成 */ File f1 = ne ...
ionic--配置路由
1.ng-route index中引用文件: <script src="ionic.bundle.js"></script> <script src= ...
Java基础之引用（String，char[]，Integer）总结于牛客网的专项练习题
1.String的引用: 下列代码执行后的结果为: public class Test { public static void main(String[] args) { StringBuffer ...
Linux（Ubuntu16.04）下添加新用户
某些情况下,Ubuntu 使用useradd 新用户名,在home 文件夹下面看不到新创建的用户文件夹,例如: 发现找不到,spark的文件夹,因此将采用下面方式重新建立首先删除spark用户若想给 ...
String class fetch functionality
String类的获取功能: package com.itheima_04; /* * String类的获取功能: * int length():获取字符串的长度,其实也就是字符个数 * char ch ...
Aspose.Pdf v8.4.1 发布
.NET v8.4.1: 修复的错误及漏洞: PDF到JPEG时,内容从最终JPEG文件中丢失. 书签缩放识别错误. Java v4.2: 新特性: 搜索分离超过两行的文本. 修复的异常: PDF到 ...
EF中使用SqlQuery执行语句
string sql = @" SELECT B.[FId], A.[FileTypeNo], A.[FtypeName], A.[FtypeId], A.[ProcessName], A. ...
asp.net生成PDF文件参考 .
TextSharp 是用来生成 PDF 的一个组件,在 1998 年夏天的时候,Bruno Lowagie ,iText 的创作者,参与了学校的一个项目,当时使用 HTML 来生成报告,但是,使用 ...
Python学习---Java和Python的区别小记
Java和Python的区别小记注意这里使用的是 and/or/not 非java中的&&,||,!Java中的true是小写 Python中函数就是对象,函数和我们之前的[1,2 ...

闲话缓存：ZFS 读缓存深入研究-ARC（一）

闲话缓存：ZFS 读缓存深入研究-ARC（一）的更多相关文章

随机推荐

热门专题