https://mp.weixin.qq.com/s/TSwKL_qm-b-0e8x7r--hhg

 
简单介绍Atomics中数学运算、逻辑运算的实现。
 
 
1. io
 
Atomics是一个硬件模块,他继承自Modules:
 
IO端口定义如下:
其中:
a. write: 是否写操作;
b. a:输入操作类型及一个操作数;
c. data_in:输入另一个操作数;
d. data_out:输出计算结果;
 
2. Arithmetic params
 
处理channel a传入的params:
 
Channel A上的ArithmeticData消息的params定义如下:
对应代码,可以看到params各比特的意义:
a. io.a.params(2):如果这一位为1,则表明运算为加法运算;
b. io.a.params(1):如果这一位为1,则表明为无符号运算;
c. io.a.params(0):如果这一位为1,则表明为取最大值运算;如果为0,则为取最小值运算;
 
3. Arithmetic
 
数学运算逻辑的实现如下:
 
1) signBit
 
io.a.mask中的每一位对应着io.a.data中的一个字节。mask中为0的位对应的字节无效,不参与运算。mask中为1的位对应的字节才可以参与运算。那么io.a.data的符号,则由io.a.mask中最高的值为1的位对应的字节决定。
 
signBit的意义即为取出mask中最高的一个为1的位。只有mask中最高的值为1的位对应的比特值为1,其余比特的值都为0。这样可以作为掩码选出io.a.data中决定符号的字节。
 
这个左移一位相与的实现,有一个隐含条件:mask中值为1的比特要连续。
 
这一点由规范中对io.a.mask的要求来满足:
 
2) inv_d
 
如果是加法,则直接使用原值即可。如果是减法,则需要取反加一。
 
3) sum
 
相加:
a. 把io.a.mask中的每一位扩展为8位:FillInterleaved(8, io.a.mask)
b. 使用扩展之后的掩码去掩io.a.data,把无效的字节掩掉:FillInterleaved(8, io.a.mask) & io.a.data
c. 与inv_d相加: + inv_d
 
根据inv_d的取值,决定结果是和还是差:io.a.data - io.data_in = io.a.data + ~io.data_in + 1。
所以如果sum是差值,那么还需要加1才是真正的差值。
 
4) sign
 
计算输入参数的符号:
a. 输入参数x是一个UInt;
b. 取出x中每一个字节的最高位:x.toBools().grouped(8).map(_.last).toList;
c. 把最高位组成一个UInt;
d. 取出最高有效字节的最高位:& signBit;
e. 以Bool类型输出最高位:.orR();
 
5) pick_a
 
如果运算是比较大小的话,是选择第一个参与比较的数字a,还是选择比较对象d:
如果选择较大的数,而a大于d则选择a;
 
6) a_bigger
 
a是不是比d大:
 
a. 如果a和d的符号不同,则取决于a_bigger_uneq的值,这个下面介绍。
 
b. 如果a和d的符号相同,则取决于两者之差的符号,即取决于sum的符号,及sign_s的值。
 
这里的一个小trick是sum并不是真正的差值,而是差值减了1的值。即:
 
sign_s是sum的符号,sign_s == 0等价于sum >= 0:
a - d >= 1的情况下,a一定大于d,不包括a == d的情况。
 
这里利用了a == d的情况下,取a或者d都是一样的,来规避求差值需要减1的逻辑消耗。
 
7) a_bigger_uneq
 
这个名字中的uneq意思就是a和d的符号不同:
A. 如果unsigned == 1:
a. 如果sign_a == 1,那么sign_d == 0,a更大,a_bigger_uneq == 1;
b. 如果sign_a == 0,那么sign_d == 0,a更小,a_bigger_uneq == 0;
 
B. 如果unsigned == 0:
a. 如果sign_a == 1为负数,那么sign_d == 0为正数,a更小,a_bigger_uneq == 0;
b. 如果sign_a == 0为正数,那么sign_d == 0为负数,a更大,a_bigger_uneq == 1;
 
可以看到a_bigger_uneq可以很好的表示两个数值的大小。
 
4. Logical
 
Logical的计算比较简单,把第一个参数和第二个参数相应的位组合在一起,总共有四种情况,组成序号0/1/2/3,根据这个序号去查表即可得到逻辑运算的结果:
 
5. 运算结果输出
 
可能输出的有四个值:0=d, 1=a, 2=sum, 3=logical
 
根据每一种操作(io.a.opcode决定)所需要值确定一个序号,然后再使用这个序号从序列中取值即可:
这里根据io.a.mask,逐个字节取值。无效字节使用io.data_in中的值。

Rocket - tilelink - Atomics的更多相关文章

  1. Rocket - tilelink - RegisterRouter

    https://mp.weixin.qq.com/s/DaJhf7hEoWsEi_AjwSrOfA   简单介绍RegisterRouter的实现.   ​​   1. 基本介绍   实现挂在Tile ...

  2. Rocket - tilelink - RAMModel

    https://mp.weixin.qq.com/s/9ccDTm6HytvfGN5R2CPoAQ   简单介绍RAMModel的实现.   ​​   1. 基本介绍   RAMModel用于定义内存 ...

  3. Rocket - tilelink - AtomicAutomata

    https://mp.weixin.qq.com/s/O7VTHqpCFNJQi3EpucXkIw   简单介绍AtomicAutomata的实现.(细节问题太多,恕不完全表述.)   ​​   1. ...

  4. Rocket - tilelink - Nodes

    https://mp.weixin.qq.com/s/KJ8pVH76rdxPOZ1vE3QlKA   简单介绍tilelink对Diplomacy Nodes的实现.   ​​   1. TLImp ...

  5. Rocket - tilelink - AsyncCrossing

    https://mp.weixin.qq.com/s/v8plWCBD8vZkxykjJe4TCg   介绍AsyncCrossing的实现,主要介绍如何实现diplomacy Node和LazyMo ...

  6. Rocket - tilelink - mask

    https://mp.weixin.qq.com/s/Gqv09RIgSSg5VKe-wb4aGg   讨论tilelink中使用MaskGen生成mask的用法.   1. tilelink中的ma ...

  7. Rocket - tilelink - Parameters

    https://mp.weixin.qq.com/s/1I6DcONr0Mg7xiX8F1C7SQ   简单介绍TileLink相关的参数实现(具体问题暂时不展开,后续用到时再做分析).   ​​   ...

  8. Rocket - tilelink - Bundles

    https://mp.weixin.qq.com/s/jrqBg2AIpQogBrpwNXjmwg   简单介绍Bundles文件中对TileLink规范(1.7.1)的定义. 参考链接:https: ...

  9. Rocket - tilelink - TLBusWrapper.to

    https://mp.weixin.qq.com/s/jSnhBzU5_ayQCg5fWAcx-g 简单介绍TLBusWrapper.to()的实现.主要介绍确定this{...}对应代码的过程. 1 ...

随机推荐

  1. Codeforces 1332 D. Walk on Matrix(构造矩阵)

    怎么构造呢? \(首先我们不可能去构造一个2000*2000的矩阵,那太复杂了\) \(也许我们可以看看2*2的矩阵??\) \[\left[ \begin{matrix} x&y\\ z&a ...

  2. VS Code的安装与配置

    VS Code的安装与配置 Visual Studio Code(VS Code)是微软旗下的一个开源文本编辑器,支持Windows.macOS.Linux操作系统.数量众多.种类多样的插件极大提高了 ...

  3. 5G新基建到来,图扑推出智慧路灯三维可视化方案

    前言 作为智慧城市的重要组成部分,智慧灯杆管理系统采用信息化.数字化手段,把路灯及城市景观照明等各种不同对象的监控和数据采集及处理融于一体, 为城市管理者进行城市管理.进行科学决策提供了强有力的手段. ...

  4. spring-boot如何去获取前端传递的参数

    本文主要讨论spring-boot如何获取前端传过来的参数,这些参数主要有两大类,一类是URL里的参数,一个是请求body里的参数 url里的参数 通过url里传过来的参数一般有三种方式,下面我们来看 ...

  5. CF#132 C. Logo Turtle DP

    C. Logo Turtle 题意 有一个海龟在一个x轴的0点,给出一个由'F','T'组成的字符序列. 海龟要按照这个序列进行行动,如果第i个字符为'F',表示沿当前方向走,'T'表示转身. 现在你 ...

  6. 移动端网站开发要点-meta设置

    <!DOCTYPE html> <!-- 使用 HTML5 doctype,不区分大小写 --> <html lang="zh-cmn-Hans"&g ...

  7. (电脑连不上热点)电脑连上了WIFI,但是显示网络不可用怎么办?

    假如WIFI没有问题的话,那这个就是电脑网络堵塞的问题了,下面是解决的办法: 情况一 1.首先win键+R打开运行框,输入cmd 2.然后在命令行输入 ipconfig -release ipconf ...

  8. Mybatis系列二-快速开发

    mybatis学习系列第二篇 分页 在网页中常常用到,在查询数据库内容并想将其输出的时候,因为有时有多组数据,一页展示过于突兀,所以会用到分页操作. 在sql用limit来分页. 首先是UserMap ...

  9. Elasticsearch URI search 查询语法整理

    Elasticsearch URI search 一.请求体查询与空查询 1. 请求体查询(request body search) 简单查询语句(lite)是一种有效的命令行adhoc查询.但是,如 ...

  10. .net core kafka 入门实例 一篇看懂

      kafka 相信都有听说过,不管有没有用过,在江湖上可以说是大名鼎鼎,就像天龙八部里的乔峰.国际惯例,先介绍生平事迹   简介 Kafka 是由 Apache软件基金会 开发的一个开源流处理平台, ...