cache是系统中的一块快速SRAM,价格高,但是访问速度快,可以减少CPU到main memory的latency。

cache中的术语有:

  1) Cache hits,表示可以在cache中,查找到相应地址的entry。

  2) Cache Miss,表示在cache中,找不到相应地址的entry。

  3) Snoop,cache不断监视transaction的地址线,来不间断的检查地址地址是否在cache中

  4) Snarf,从main memory中读出数据,同时更新cache中的旧值,称为Snarf

  5) Dirty Data,cache中的数据,是最新的,但是main memory中的数据还未更新,称cache中的数据为dirty。Stale Data类似。

arm架构中的cache架构是harvard结构的,分为data cache和inst cache。

  

  其中L1 cache,一般直接集成到core中,大小多是2-way,4-way,16KB和32KB,cache line一般是32byte或者64byte。

                    可以实现为VIPT或者PIPT。

    L2 cache,可以集成到core中,也可以单独作为一个external block,大小多是8-way以上,256KB,512KB,1M等,cache line也是32byte,64byte。

                    一般实现为PIPT。

cache的架构,分为read architecture,write policy,allocation policy。

  1) read分为,Look Aside和Look Through,

    Look Aside,main memory和cache都在同一时间,看到同一bus上的trans。

      优点:减少了cache miss下的 memory访问时间,

      缺点:在一个core访问main memory时,另一个core不能访问cache。

      

    Look Through,

  不管是哪一种的read architecture,cache miss之后,从main memory中得到的value都会被Snarf到cache中

  2) write policy,

    write-back时,将数据写到cache中,cache就像一个buffer,在evict一个新的cache entry时,才会将cache写会main memory。

      存在cache和main memory的consistency问题。需要进行cache maintenance操作(如cache line置换,mmu page置换修改等),

        主要分为cache invalid(舍弃cache中的值,将valid flag置零)和cache update操作(更新main memory的值为cache中的值)。

    write-Through时,读写性能要低一些,但是main memory中都是最新的value。不存在cache和main memory的一致性问题。  

  3) cache miss之后,是否allocate新的entry:

    read-allocated;读操作miss之后,先从main memory中读取数据给core,之后在进行cache line snarf

    write-allocated;在write miss之后,需要先进行burst read,进行cache line snarf,之后进行write back操作(一般与write back一起使用)。  

 

cache block会被分为三个functional blocks,Data RAM,TAG RAM,Cache Controller。每个cache 单元需要保存address,data,status等信息,所以cache真正的大小会比data ram大很多。 

  1) cache controller也会根据memory request是否是cacheable的来进行cache的寻址操作。

  2) tag cache,主要存储VA,PA的地址索引。平时所指的cache size并不包含tag ram的大小

  3) offset寻址具体的wordindex寻址某一个way,也就是某一个cache linetag主要做地址校对,最终选择tag匹配的那一个set

    在set-associate结构的cache中,main memory中所有index相同的地址,都只能放在对应的way中。

  

Cache的organization:

  1) Cache Page,main memory中被等大小的分为的piece,称为cache pages

    cache page的大小,不但与总的cache size有关,与cache的organization也有关

  2) Cache line,cache page中更小的单元,cache缓存的最小单位。

    

  cache的组织结构有三种,

    1) 分为full-Associative,全相联映射。没有cache page的概念,每个cache line直接对应到随机的某个memory line中。

      缺点是,TAG ram会比较大,索引会比较慢,一般应用在cache较小的地方,如tlb或者predict buffer中

      

    2) Direct-Map,直接映射,也称为1-way associative,main memory分为多个cache page,中的第n line,必须放在cache page的第n行。

      复杂度不高,但是,性能很差,常常需要evict其他的cache line,不够灵活

      

    3) N-way Set-Associative,组映射,比如2-way,4-way等,还有一个Set的概念,表示cache page的行数。

      每个组分为N份,N称为cache way。每个cache way内部的映射,就与direct mapping相同

      set到main memory的映射,随意,与full-associative相同

      所以一块main memory,首先随意映射一块地址到set中,然后每个set在平分为几个way,直接查找几个way即可。

        way中的line 映射,是一一对应的,不能够随意破坏行的顺序

      2 way的映射图:

      

      在使用N-Ways Set-Associative时,这是一种阵列的表现方式

        一个组里有N行,其实是N个set,但是set中的每一行与main memory分的cache page中的行数是一样的。

        cache首先被分为多个Set,S等于1时,也就是1个Set,这时,等同于Direct-Associative

                    N等于1时,也就是说1个Way,这时,等同于Full Mapped

       cache的大小等于cache_line_size * way_num * set_num

        

cache line的结构:

  1) data段存放cache line中的数据,大小通常为32byte或64byte,一个bus的wrap操作。

  2) status段,存放cache的状态,可以是MOESI等。

  3) Tag段,存放部分物理地址信息,可能包含虚拟地址信息,(VA的Cache索引可以与VA的地址转换同时进行)

    

PA地址的cache索引,最低位是word的寻址,之后是way(cache line)的寻址,再之后才是tag的寻址;

  

cache hier的问题:在不同的微架构中,L1与L2的关系可以是inclusive的,也可以是exclusive的,

  inclusive cache:相同的data可以存放在Both L1和L2中。

  exclusive cache:相同的data只能放在L1或者L2中,不能同时存在。

  目前一般使用inclusive cache类型,每次cache miss,可以从下一级的cache中寻找,load。而exclusive cache,每次cache miss,只能去main memory中load。

    但是exclusive cache比较节省cache size。

cache基础的更多相关文章

  1. Cache基础知识OR1200在ICache一个简短的引论

    以下摘录<步骤吓得核心--软-core处理器的室内设计与分析>一本书 12.1 Cache基本知识 12.1.1 Cache的作用 处理器的设计者通常会声称其设计的处理器一秒钟能做多少次乘 ...

  2. OpenRisc-41-or1200的cache模块分析

    引言 为CPU提供足够的,稳定的指令流和数据流是计算机体系结构设计中两个永恒的话题.为了给CPU提供指令流,需要设计分支预测机构,为了给CPU提供数据流,就需要设计cache了.其实,无论是insn还 ...

  3. Guava Cache探索及spring项目整合GuavaCache实例

    背景 对于高频访问但是低频更新的数据我们一般会做缓存,尤其是在并发量比较高的业务里,原始的手段我们可以使用HashMap或者ConcurrentHashMap来存储. 这样没什么毛病,但是会面临一个问 ...

  4. Cortex_m7内核cache深入了解和应用

    一,cache概述 从下图可以看出,从M7内核才开始有的cache,这对于从M0,M3,M4一路走来的小伙伴来说,多了一个cache就多了一个障碍. Cortex-M7 core with 32K/3 ...

  5. 并发读写缓存实现机制(一):为什么ConcurrentHashMap可以这么快?

    大家都知道ConcurrentHashMap的并发读写速度很快,但为什么它会这么快?这主要归功于其内部数据结构和独特的hash运算以及分离锁的机制.做游戏性能很重要,为了提高数据的读写速度,方法之一就 ...

  6. Retrofit的初次使用

    rxretrofitlibrary是一个已经写好的网络框架库,先以本地Module导入到自己的项目中. 1.它的初始化操作大多在自定义的application中完成,如: public class A ...

  7. wordpress缓存插件使用提高网站速度

    WordPress是世界上使用量最多的CMS,由于程序非常吃主机性能,正常情况下当页面被访问时,使用php和mysql. 因此,系统需要消耗RAM和CPU. 如果同一时间有大量访客访问,系统将使用大量 ...

  8. MyBatis 源码分析-项目总览

    MyBatis 源码分析-项目总览 1.概述 本文主要大致介绍一下MyBatis的项目结构.引用参考资料<MyBatis技术内幕> 此外,https://mybatis.org/mybat ...

  9. Mybatis源码学习第六天(核心流程分析)之Executor分析

    今Executor这个类,Mybatis虽然表面是SqlSession做的增删改查,其实底层统一调用的是Executor这个接口 在这里贴一下Mybatis查询体系结构图 Executor组件分析 E ...

随机推荐

  1. Page14:状态观测器[Linear System Theory]

    内容包含状态观测器设计分类及其特点 状态观测器设计与状态反馈之间的关系问题 带补偿器动态输出反馈与带状态观测器的状态反馈等价原理 由于第二部分频域部分较为简单,因此仅整理时间域部分

  2. [skill] C语言数组名到底是个啥

    1. 正常情况下,数组名是个地址常量. 2. sizeof(数组名)的时候,数组名就代表数字名,其类型为 type array[], 返回数组元素个数. 3. 除了2的情况以外,可以理解为一个指针常量 ...

  3. ORA-01950: no privileges on tablespace XXX

    原因是该表空间没有为用户提供配额空间 alter user WANGGUAN quota unlimited on TS_ACCT_DAT_01; 在表空间中为该用户设置磁盘配额即可

  4. PHP 小知识

    -- 获取/设置响应的 HTTP 状态码 mixed http_response_code ([ int $response_code ] ) -- ... 操作符知道是什么么?看看 PHP 官方的 ...

  5. Python开发【笔记】:aiohttp搭建简易聊天室

    简易聊天室: 1.入口main.py import logging import jinja2 import aiohttp_jinja2 from aiohttp import web from a ...

  6. ubuntu编译opencv3.1遇到的问题

    网上有很多关于编译的具体步骤,我也是按照网上的说明一步步操作的,这里主要想记录的是在安装完之后,import cv2不存在以及其他的libopencv_hdf.so.3.1等找不到的问题,如果将这样的 ...

  7. CSS中position属性介绍(新增sticky)

    position的含义是指定类型,取值类型可以有:static.relative.absolute.fixed.inherit 和 sticky,这里sticky是CSS3新发布的一个属性. 1.po ...

  8. 程序------>数据结构

    一程序概念: 1.对身边的任何一个事物进行认知和分类,从而得到一些信息: 2.在得到的信息基础之上建立了概念模型: 3.根据概念模型将我们生活中的实际问题转换成计算机能理解的形式: 4.用户通过人机交 ...

  9. 【SQL】from a,b。表a 和b之间是什么关系?

    1.select a.id from a,b……——>这里a和b用逗号隔开,a,b之间默认是inner join的关系.

  10. java多线程和.net多线程区别与联系

    在网上搜了好多,没有搜到这方面的内容,自己浅薄写点吧. 1..net和java的主线程和子线程,原理是类似的 (1).当子线程是前台线程时,主线程结束,子线程并未结束(还将继续运行,即进程未结束) ( ...