https://mp.weixin.qq.com/s/_aJqf1cFJDK5RVRBhxTWOw
介绍MaskGen的实现。
1. 基本介绍
给定总线宽度beatBytes,根据访问的地址(address)和访问的字节数(bytes = 2^lgSize),生成访问字节的掩码。
2. 实现
思路不复杂,写法很难懂。重构一下,提高可读性。
1) 首先忽略groupBy,清爽很多:
2) 把addr_lo重命名为address,把lgSize重命名为size,这样可以很明显的看出来address/size是一对参数。把内部的局部变量size重命名为siz。
3) 把beatBytes重命名为width,同时把lgBytes重命名为lgWidth
4) log2Up与log2Ceil意义相同,且被废弃,使用log2Ceil替代。替代之后发现,无需重新计算,直接使用lgWidth即可:
5) nbit的命名挺别扭,既不符合RTL习惯(bit_n),也不符合软件习惯(有下滑波浪线提示)。因为只有一处使用,所以可以直接去掉,无需使用临时变量。
上面这些重构比较简单,基本上都是从形式上进行。
6) 把helper重命名为getMask
从apply的返回值看,helper的返回值即是最终生成的掩码,只是位序相反。所以把helper从中性无意义的名字,修改为getMask这一个表示用途的名称:
7) i的意义
helper是递归方法,i每次减一。
helper(0)返回1位掩码:1 = 2^0;
helper(1)返回2位掩码:2 = 2^1;
helper(2)返回4位掩码:4 = 2^2;
把helper(i)中的i从对数值,换成原值,参数i的意义就是要返回的掩码位数:helper(n),n为要返回的掩码的位数。
helper(1)返回1位掩码;
helper(2)返回2位掩码;
helper(4)返回4位掩码;
调整内部对n的使用:
a. 对数值减法换为原值的除法;
b. 判断对数值为0,等价于判断原值为1;
8) 提取重复代码:log2Ceil(width / n)
width为mask的总宽度,n为要求取的掩码数。
width/n是把原有总共width个比特分成n个组(group),其值为每个组包含的比特数。
这样n的意义,除了表示求取的掩码数,也表示把原width个比特,划分成的小组的数目。
9) j重命名为group
生成掩码时使用的序号为j:
因为每个小组一个掩码,这个j同时也是小组的编号,将其从中性无意义的j,重命名为group,以表示小组的编号:
10) 重命名getMask为getMaskForNGroups
把getMask重命名为更清楚表达用途的名称getMaskForNGroups:
11) acc的意义
MaskGen是要生成访问内存的掩码。可以推测acc是访问(access)的意思。
更进一步,acc是一个标志位,标志着否访问所对应的group。这里有两个不同的可能意义:
a. 访问组内的比特对应的全部字节;
b. 访问组内的比特对应的部分字节;
12) n == 1
当n=1时,把所有width个比特看出一个整体,生成一位掩码。其实现为:
其中:acc = size >= UInt(lgWidth),eq = Bool(true)。
当acc=true时,size >= lgWidth,即要访问的长度,大于总线宽度。也就是说width个字节都要访问,即组内各比特对应的字节全部都要访问。这里把上面acc两种可能意义中的b排除掉了。
13) sub_acc
所谓sub,实际上是上一个层次,即当自己为1/4时,所在的1/2。
从acc的实现可以看出,如果sub_acc为真,则acc为真。意义为:如果width个比特中,如果某1/2的acc为真,则标志着这1/2个比特对应的字节全部都要访问,那么包含在这1/2中的2个1/4自然也都是要访问的。
14) bit = address(lgBitsInEachGroup)
用于计算地址中的偏移量,如同样访问一个字节,从0x0000开始访问与从0x0001开始访问的掩码是不同的,分别为0b0001和0b0010。
根据bitsInEachGroup的不同,其所对应的地址偏移量也不同。
如果小组内有1个比特,则每个组占用的偏移量为1个字节;
如果小组内有2个比特,则每个组占用的偏移量为2个字节;
如果小组内有4个比特,则每个组占用的偏移量为4个字节;
bit代表address中,与group占字节数相对应的地址位。比如:
当bitsInEachGroup=1时, lgBitsInEachGroup=0,取address的第0位,该位代表的偏移量为1;
当bitsInEachGroup=2时, lgBitsInEachGroup=1,取address的第1位,该位代表的偏移量为2;
当bitsInEachGroup=4时, lgBitsInEachGroup=2,取address的第2位,该位代表的偏移量为4;
15) siz = sizeOH(lgBitsInEachGroup)
与小组占字节数相对应的大小位:
当bitsInEachGroup=1时, lgBitsInEachGroup=0,取sizeOH的第0位,代表访存大小是否为1;
当bitsInEachGroup=2时, lgBitsInEachGroup=1,取sizeOH的第1位,代表访存大小是否为2;
当bitsInEachGroup=4时, lgBitsInEachGroup=2,取sizeOH的第2位,代表访存大小是否为4;
siz用于计算acc:
在sub_acc为假的情况下,即当前1/4所在的1/2没有被完全访问的情况下,计算当前1/4是否被全部访问。
siz为其中一个条件,意义为:访存大小等于当前1/4所含的比特数。
a. 如果访存大小小于当前1/4所含的比特数,则无法全部涵盖当前1/4,则acc=false;
b. 如果访存大小大于当前1/4所含的比特数,则size大于等于1/2包含的比特数;同时因为sub_acc为假,所以当前1/4所在的1/2都没有被访问。那么当前1/4也没有被访问,即acc=false;
16) eq
eq的意义为:当前小组是否被访问(全部或者部分)。
当n=1,即所有width个比特都在一个组内的情况下,eq为真,即总被访问(全部或者部分)。
sub_eq的意义为:当前1/4小组所在的1/2小组是否被访问。若要所在的1/2没有被访问,则当前1/4也不可能被访问:
如果所在的1/2全部被访问,则sub_acc=true,两个1/4的acc也都为true;
如果所在的1/2部分被访问,则sub_acc=false,两个1/4中只有一个被访问。至于哪一个被访问,则与bit的值有关。
第一个1/4(group%2=0)是否被访问与!bit相同;
第二个1/4(group%2=1)是否被访问与 bit相同;
即:
如果bit=0,则第一个1/4被访问;
如果bit=1,则第二个1/4被访问;
结合bit的意义:
如果bit=0,则从基地址0开始访问;
如果bit=1,则需要加上一个偏移量;
17) eq的命名
eq是equal的缩写,相等的意思。
相等涉及两个参量,a=b,这里的eq表示谁和谁相等呢?
被访问的小组和当前小组?
这个名称提示意义不足。
18) acc总结:
若要acc为真,有两种可能:
a. sub_acc为真,即1/4所在的1/2全部要访问;
b. siz && eq: 访问的大小与当前小组的大小一致,并且当前小组被访问。也就是当前小组被全部访问。
19) acc与eq重命名
acc => allBitsInGroupAccessed;
eq => anyBitsInGroupAccessed;
这样是不是更容易理解一些?
3. groupBy
按注释:
groupBy的功能是把width个比特,分成每groupBy个比特一组,每一组中原来的掩码使用OR reduction求一个值作为新的掩码值。
然而groupBy的实现是错的。没有发现是因为现有工程中,没有使用groupBy的功能,都是默认值1。
实现中:
else里面求取的是_._1,即allBitsInGroupAccessed。也就是说分组中全部的比特都要被访问,而不是只要一个比特被访问即可,是AND reduction,而非OR reduction。
_._2即anyBitsInGroupAccessed是OR reduction,但是生成的mask是错误的。所以groupBy的实现实际上是错误不可用的。
把groupBy加回来:
1) 没有必要判断groupBy == width
当width == groupBy时,else中返回的也是UInt(1),所以没有必要单独判断:
2) width / groupBy
groupBy即是每个小组中包含的比特数,width / groupBy是分成的小组的个数。
3) UInt(groupBy * 2 - 1)
生成一个掩码,其中位[groupBy-1, 0]为1。
4) 对sizeOH的影响
若读取的字节数大于groupBy包含的比特数(每个比特对应一个字节),则没有影响;
若读取的字节数小于groupBy包含的比特数,则相当于把读取的字节数拓宽到groupBy中包含的比特数个字节。
例如:
size=0(读取的字节数为1),groupBy=2(最小分组包含2个比特):
原sizeOH=0b01,新sizeOH=0b11。
sizeOH(1)=1,起到读取了2个字节的效果。
4. 实例
很遗憾的是,与注释中的例子不一样:
欢迎指出我的错误之处,谢谢!
5. 附录
略
- Rocket - util - Misc
https://mp.weixin.qq.com/s/kf4FvAFye_bRdT49Yow7Hg 简单介绍Misc中各个辅助方法的用途和实现. 1. ParameterizedBu ...
- Rocket - util - Annotations
https://mp.weixin.qq.com/s/7C8ZmPpwAqFqyKjL9K40Fg 介绍util中定义的注解(Annotations). 1. Annotation ...
- Rocket - util - Timer
https://mp.weixin.qq.com/s/Z4JJhZ_jL1lqF1nf_orq9A 简单介绍Timer的实现. 1. 基本功能 实现定时器的功能. 2. Ti ...
- Rocket - util - Replacement
https://mp.weixin.qq.com/s/zCP7wPuxgQ-r94Tr6BV5iw 简单介绍Replacement的实现. 1. 基本介绍 用于实现Cache替换 ...
- Rocket - util - ReduceOthers
https://mp.weixin.qq.com/s/gbR5fuDbE_nUFVxw-p4rsA 简单介绍ReduceOthers的实现. 1. 基本介绍 输入一组Bool元素 ...
- Rocket - util - Repeater
https://mp.weixin.qq.com/s/xyEq3DgYuf2QuNjssv8pkA 简单介绍Repeater的实现. 1. 基本功能 A Repeater pas ...
- Rocket - util - PrefixSum
https://mp.weixin.qq.com/s/G2vLP-ncoJzSOgxGGEJkfA 简单介绍PrefixSum的实现. 1. 基本介绍 把一个序列从前向后逐 ...
- Rocket - util - MultiWidthFifo
https://mp.weixin.qq.com/s/CUnrpyQN5LRBR5bxC5u86A 简单介绍MultiWidthFifo的实现. 1. 基本介绍 实现一个输入宽度 ...
- Rocket - util - LanePositionedQueue
https://mp.weixin.qq.com/s/yO_9Ec3S5-AosRVLpsBgOg 简单介绍基于通道位置的队列(LanePositionedQueue)的实现. 1. ...
随机推荐
- ssm(spring,spring mvc,mybatis)框架
ssm框架各个技术的职责 spring :spring是一个IOC DI AOP的 容器类框架 spring mvc:spring mvc 是一个mvc框架 mybatis:是一个orm的持久层框架 ...
- LeetCode--Jewels and Stones && Range Sum of BST (Easy)
771. Jewels and Stones (Easy)# You're given strings J representing the types of stones that are jewe ...
- STM32学习笔记——GPIO
单片机型号STM32F407VET6. 概述 GPIO的分类: 可接受5V输入的(FT),绝大多数引脚都是: 只能接受3.3V输入的(TTa),只有PA4和PA5,就是DAC输出的两个引脚: 其他,包 ...
- 【不断更新】mysql经典50道题自我练习
mysql经典50道题自我练习 测试数据和练习题均转载自CSDN博主@启明星的指引的文章sql语句练习50题(Mysql版),用于mysql的每日自我练习 表名和字段 –1.学生表 Student(s ...
- Spring JDBC 框架使用JdbcTemplate 类的一个实例
JDBC 框架概述 在使用普通的 JDBC 数据库时,就会很麻烦的写不必要的代码来处理异常,打开和关闭数据库连接等.但 Spring JDBC 框架负责所有的低层细节,从开始打开连接,准备和执行 SQ ...
- failed parsing overlays.
clearn + rebuild + 重新运行: 删掉模拟器进程 + 重新运行:
- neo4j 图数据库安装及介绍
neo4j 图数据库安装及介绍 一.neo4j图数据库介绍 图数据库,顾名思义就是利用了"图的数据结构来作为数据存储逻辑体现的一种数据库",所以要想学好图数据库当然需要了解一些关于 ...
- 一个小例子学习makefile
前言 makefile推荐资料为陈皓的跟我一起写makefile,需要pdf资源的可以私我 正文 目录结构 ---include ------student.h ---src ------studen ...
- 黑马程序员_毕向东_Java基础视频教程——进制的相互转换(随笔)
进制的相互转换 二进制转十进制: 原理对十进制数进行除2运算(余数不是0 就是1) 6 的二进制: 6 / 2 = 3--0 3 / 2 = 1--1 1 / 2 = 0--1 余数倒序排列输出:11 ...
- chrome "items hidden by filters"
今天更新chrome 后遇到console不能显示errors的问题,折腾一番后发现在console的Default levels中选择Default即可.