https://mp.weixin.qq.com/s/9ccDTm6HytvfGN5R2CPoAQ
简单介绍RAMModel的实现。
1. 基本介绍
RAMModel用于定义内存访问模型,即统计内存访问信息,并进行验证,以确定是否存在非法访问。
2. MonitorParameters
封装监控参数,包括访问地址和访问大小:
3. ByteMonitor
一个字节的监控信息,包括是否有值、值:
4. FlightMonitor
封装正在等待响应消息的请求消息的信息,包括:请求的地址、请求的大小,请求的类型:
5. TLRAMModel
1) 类参数
a. log:日志信息前缀;
b. ignoreCorruptData:忽略错误数据;
c. ignoreDeniedData:忽略被拒绝的数据;
2) diplomacy node
是一个适配器节点,用于与上下游节点相连接:
这里diplomacy node什么都不做,也表明lazy module中不需要实现转换逻辑。
3) lazy module
那么lazy module中要做什么呢?实现一个内存访问的监控模型。
A. 成对的输入边和输出边
B. 基本参数
其中:
decTrees表示计量最大传输大小的请求包含的beat数目所需要的比特数。
C. wipeIndex
a. wipeIndex是一个初始值为0的寄存器;
b. wipe是wipeIndex最高位取反;
c. wipeIndex每个时钟周期都要自加wipe的值;
不考虑wipeIndex除MSB以外的其他位,相当于wipeIndex的MSB每个时钟周期都取反,wipe的值也每个时钟周期都取反,两者的值差一个时钟周期。
D. 若wipe为真,则阻塞channel a/d:
根据wipe值的特点,也就是每隔一个时钟周期channel a/d都要被阻塞。
E. 不支持channel b/c/e:
F. 一组存储器:
其中:
a. shadow
beatBytes * endAddressHi = endAddress,也就是创建针对每一个字节的监控参数存储空间;
b. inc_bytes/dec_bytes
countBits是计量sourceId总数所需要的比特数,那么inc_bytes/dec_bytes针对每一个字节创建一个记录访问该字节的source个数的存储空间,用于记录每个字节是正被多少个source访问。
c. inc_trees/dec_trees
访问大小size域的值是一个2的对数值,所以访问大小是以2的倍数逐渐增大的。记录beatBytes内的访问大小的source的个数,使用inc_bytes/dec_bytes即可。那么访问大小2*beatBytes对应的请求的source个数应该记录在endAddressHi >> 1对应的监控信息中,以此类推。
G. 是否使能各项监控信息的记录
H. 记录某个sourceId是否有请求存在
I. channel a的请求监控信息
J. 记录channel a的请求信息
K. 取出channel d回应的请求信息
其中:bypass已经见过多次,指能否在请求下发的同一个时钟周期返回响应消息。
L. 提取channel a中请求的各项信息
M. 获取相应地址对应的访问监控信息
a. a_inc_bytes/a_dec_bytes表示访问大小小于等于beatBytes时访问到该字节的source的个数;
b. a_inc_trees/a_dec_trees表示访问大小大于beatBytes时访问到该字节的source的个数;
c. a_inc_tree/a_dec_tree表示对大于beatBytes的访问source的计数进行求和;
d. a_inc/a_dec表示再加上访问大小小于等于beatBytes的访问source的计数;
N. a_fire
a. 不支持Acquire操作:
b. 记录a.source存在访问请求
c. 打开字节访问source统计使能:
这里排除掉Hint和Get消息,表明不改变内存内容的消息不被逐字节监控。
另外,若访问大小小于或等于beatBytes,那么a_sizeOH >> (shift+1) == 0,也就是说不会打开inc_trees_wen。
d. 若消息可能改变内存内容,则打开shadow_wen,并记录信息:
其中:
- a.mask对应着访问到的字节;
- busy表示某个字节是否已经被某个source访问;减去(!a_first)是因为寄存器的特性,a_first对a_inc的改变需要到下一个时钟周期才能表现出来;
- 无论size域的值是多少,data总是以beatBytes为单位传输的(单时钟小于或等于beatBytes),所以这里的i只在0和beatBytes之间取值;
e. 记录Get消息的信息:
f. 讨论
channel a支持的消息类型如下:
在a中首先排除掉Acquire消息的情况下,c和d中对消息类型的判断实际上是等价的,即不是Hint也不是Get,就是PF/PP/A/L之一。
O. 更新inc_bytes/inc_trees的值
不考虑wipe的情况下,这里根据相应wen的值,对inc_bytes和inc_trees进行更新。
存储监控信息的地址,是相应请求的地址:
P. shadow
参考第6节。
Q. CRC
略
R. 响应消息的基本信息
S. d_inc/d_dec
T. d_fire
a. 判断size域是否与请求信息中相同
b. HintAck需要与Hint请求配对:
c. 每字节使用计数的使能开关打开
只有响应消息的最后一个beat时才打开:
下面会生成逻辑递减使用计数:
d. 响应消息的地址范围是否与某个请求重叠?
如果有,则对应的请求不合法。
e. AccessAck与PutFull和PutPartial配对:
f. AccessAckData与Get/Arithmetic/Logical配对:
g. 对返回的每个字节进行判断:
返回数据是以beatBytes为单位进行的,每次返回的数据不能超过总线宽度(beatBytes),所以这里使用0 until beatBytes;
h. 取出返回的数据与shadow中的数据进行比对:
d_mask决定了哪些字节是合法的返回数据。
i. 如果shadow中没有存储监控数据:
RAM也就是内存不是数据的源头,RAM只是处理中的数据。也就是说,内存中每一个字节最开始都是未初始化的,需要先从别处把数据写入内存中(Put),而后参与运算。
所以如果内存中的数据初始化了,那么shadow中的数据也应该是合法的;反之,如果shadow中存储的监控数据不合法,那么内存中的数据也是非法的。
使用到非法的数据存在两种情况:
- 未初始化,即该字节还从未存储过合法数据;
- Get请求在Put请求之前:Get, Put, Ack, Ack;如果不支持fifo,那么AccessAckData看到的shadow.valid为假;
j. 判断计数值是否相等:
分类讨论一下。
先看Get请求。
处理Get请求时,不会增加inc的值,也不会增加dec的值,所以两者应该相等。如果不等,那么就是有一个PP/PF/A/L请求在飞(inflight,即未得到回复)。这里两者不等是一个错误。
再看Arithmetic和Logical请求。
A/L请求发出时,会增加inc的值,得到回复消息时会增加dec的值。而增加dec的值是在最后一个beat(d_last)时做出的,到再下一个时钟周期才会生效。也就是说这里读到的dec的值,是增加之前的,所以理应比inc少1。即两者不等才是正常情况,相等是错误情况。
所以这里针对A/L请求这样判断是有问题的。(欢迎讨论指正)
k. 判断是否有地址范围重叠的请求:
如果有一个地址范围重叠的请求同时完成,那么那个请求就会把对应的valid清掉,这里就会发现d_valid == false:
判断d_fifo是因为如果是fifo的话,即便有另外一个Put请求先完成清掉了对应的valid位,也不会导致内存值不确定。因为是fifo,最后一个Put的数据生效。所以可以放过d_valid == false的情况。
l. 检查是否拒绝服务:
m. 检查是否返回错误数据:
n. 断言正确的情况:
断言shadow和got应该相等:
6. shadow
1) 释名
shadow,影子的意思。谁的影子呢?
shadow定义为存储字节监控信息,数目上足以监控manager中的全部字节:
所以shadow是manager支持的内存的影子。其中存储了内存中的每个字节应有的值,如果与内存中的值不一致,就说明内存中的值出错了。
2) 使用
a. a_shadow:首先读出shadow中对应地址字节的值;
b. a_known_old:是否某个字节的监控信息没有被存储;
c. alu:创建一个Atomics实例alu,alu的两个参数:一个是a.data,一个是a_shadow中的value;a.data是请求自带的数据,a_shadow则相当于(影子)从内存中读取的数据;
3) 赋值
当消息要修改内存中的值的时候,同时需要更新shadow中存储的值:
更新的方法如下:
A. 使用alu的输出来更新shadow中的值:
因为Atomics支持channel a的全部消息类型,所以这里的data_out能够为PP/PF/A/L产生正确的输出;
B. 判断每个字节的监控信息是否合法(不考虑wipe):
a. !busy || a_fifo:没有flight中的请求,或者请求是按照fifo的顺序响应的。如果不是fifo的顺序,那么可能会存在插入其他消息,导致shadow中存储的监控数据不合法;
b. !amo || (a_known_old && beat_amo):不是amo消息,如果是amo消息,则要求实现已经在shadow中存储了内存中的数据信息,并且amo请求的大小不能超过beatBytes。当请求为Arithmetic消息时,高字节的值会影响到低字节的值,所以如果请求大小大于beatBytes,下一个beat中传入的数据可能改变上一个beat中计算的结果,进而导致监控数据不合法;
7. wipe
wipe看上去没有什么实际的意义。
1) 用于生成wipeIndex
每隔一个时钟周期改变一下值(取反)。
2) 用于阻塞channel a/d一个时钟周期
这里注释中的wiping Mems是指擦除内存,但是没看到擦内存的动作。
3) 用于生成监控信息写使能的初始值
4) 用于选择监控信息的地址
当wipe == true时,a_waddr = wipeIndex:
若wipe==1,则wipeIndex的最高位为0,进而可知wipeIndex == 0。所以a_waddr并未超出各个监控Mem的容量限制。
写地址0的意义何在?
5) 用于选择写入inc/dec中的值:
6) 用于生成shadow的valid值:
8. inc/dec
1) 只增不减?
两者都是递增加1,没有看到在哪里减小他们的值。
可以看到对两者的对比都是看是否相等,而不会比对值的大小。
这样使用不需要减小他们的值,溢出时会自动返回0。
如果发起的请求太多,inc溢出为0,而dec因为没有一个响应而为0呢?
这是一个异常情况。
2) countBits
inc/dec中每个监控单元的计数值占用的比特位数为countBits:
countBits是endSourceId占用的比特数:
endSourceId是输入边的所有client的source中最大的值:
因为每个存储单元的比特数能够存储最大的sourceId,
所以第一个推测是:inc/dec中存放的是访问某字节的source的值。
然而这种推测是错的。
看到了inc/dec加一,
产生第二个推测是:inc/dec中存放的是访问某字节的不同source的数目。
然而这种推测也是错的,inc/dec增加时并不区分source是否与已记录的相同。有记录每个source的请求信息吗?有,是flight:
所以这里与其用countBits误导,不如直接使用一个无意义的值,比如4/5/6/8等等。
- Rocket - tilelink - RegisterRouter
https://mp.weixin.qq.com/s/DaJhf7hEoWsEi_AjwSrOfA 简单介绍RegisterRouter的实现. 1. 基本介绍 实现挂在Tile ...
- Rocket - tilelink - Nodes
https://mp.weixin.qq.com/s/KJ8pVH76rdxPOZ1vE3QlKA 简单介绍tilelink对Diplomacy Nodes的实现. 1. TLImp ...
- Rocket - tilelink - AsyncCrossing
https://mp.weixin.qq.com/s/v8plWCBD8vZkxykjJe4TCg 介绍AsyncCrossing的实现,主要介绍如何实现diplomacy Node和LazyMo ...
- Rocket - tilelink - mask
https://mp.weixin.qq.com/s/Gqv09RIgSSg5VKe-wb4aGg 讨论tilelink中使用MaskGen生成mask的用法. 1. tilelink中的ma ...
- Rocket - tilelink - Parameters
https://mp.weixin.qq.com/s/1I6DcONr0Mg7xiX8F1C7SQ 简单介绍TileLink相关的参数实现(具体问题暂时不展开,后续用到时再做分析). ...
- Rocket - tilelink - Bundles
https://mp.weixin.qq.com/s/jrqBg2AIpQogBrpwNXjmwg 简单介绍Bundles文件中对TileLink规范(1.7.1)的定义. 参考链接:https: ...
- Rocket - tilelink - TLBusWrapper.to
https://mp.weixin.qq.com/s/jSnhBzU5_ayQCg5fWAcx-g 简单介绍TLBusWrapper.to()的实现.主要介绍确定this{...}对应代码的过程. 1 ...
- Rocket - tilelink - BusWrapper
https://mp.weixin.qq.com/s/03BvgTNQtD75Guco6gUGQg 简单介绍BusWrapper的实现. 1. HasTLBusParams 定义SoC的挂 ...
- Rocket - tilelink - Xbar
https://mp.weixin.qq.com/s/UXFHYEQaYotWNEhshro68Q 简单介绍Xbar的实现. 1. 基本介绍 用于为Xbar的输入和输出连接生成内 ...
随机推荐
- 【XR-3】核心城市(树直径)
[XR-3]核心城市 这题真的难啊......... k个核心城市太麻烦,我们假设先找一个核心城市,应该放在哪里? \(任意取一个点,它的最远端是直径的端点.\) \(所以当这个点是直径的中点时,可以 ...
- window下用notepad++编辑了脚本文件然后放在linux报错显示无法运行
首先vi :set ff 查看文件类型 接着 下载dos2unix root用户下yum -y install dos2unix 然后 dos2unix 文件.sh 转换格式 接着在正常启动即可
- 【2020Java最新学习路线】写了很久,这是一份最适合普通大众、科班、非科班的路线
点赞再看,养成习惯,微信搜索[三太子敖丙]关注这个互联网苟且偷生的工具人. 本文 GitHub https://github.com/JavaFamily 已收录,有一线大厂面试完整考点.资料以及我的 ...
- Algorithms - Priority Queue - 优先队列
Priority queue - 优先队列 相关概念 Priority queue优先队列是一种用来维护由一组元素构成的集合S的数据结构, 其中的每一种元素都有一个相关的值,称为关键字(key). 一 ...
- 栈溢出(Stack Overflow)
调用栈(Call Stack)描述的时函数之间的调用关系.它由多个栈帧(Stack Frame)组成,每个栈帧对应着一个未运行完的函数.栈帧中保存了该函数的返回地址和局部变量,因而不能再执行完毕后找到 ...
- [hdu5319]二进制表示,简单模拟
题意:给一个矩形,矩形里面画了4种符号,'.'表示没画线,'R'表示画了红线,'B'表示画了蓝线,'G'表示红线和蓝线同时画了,并且矩形主对角线上只能画红线,副对角线上只能画蓝线,问最少画多少条线才能 ...
- webpack3 项目升级 webpack4
由于 vue-cli 2 构建的项目是基于 webpack3,所以只能自己动手改动,至于升级 webpack4之后提升的编译速度以及各种插件自己去体验. 修改配置 1.替换插件 extract-tex ...
- yum安装mysql 之后问题
日志报错: 190412 15:56:50 [ERROR] Can't open the mysql.plugin table. Please run mysql_upgrade to create ...
- shell脚本常用命令汇总
一.shell脚本概述和入门 (1)shell脚本是一个命令行解释器,它接收应用程序/用户命令,然后调用操作系统内核 (2)shell脚本的常用执行方式: 第一种:采用bash或sh+脚本的相对路径或 ...
- 我找到了Dubbo源码的BUG,同事纷纷说我有点东西
点赞再看,养成习惯,微信搜索[三太子敖丙]关注这个互联网苟且偷生的工具人. 本文 GitHub https://github.com/JavaFamily 已收录,有一线大厂面试完整考点.资料以及我的 ...