RV32M指令集
Risc-V定义了可选的RV32M,它定义了整数乘法除法指令。
总共8条指令。
Category | Fmt | RV32I base | machine code(bin) | comment | |
mul | 整数乘法 | R | mul rd, rs1, rs2 | 0000001[24-20,rs2][19-15,rs1]000[11-7,rd]0110011 | rd=rs1*rs2, 将结果的低32位写入rd,对于有符号数和无符号数相乘,结果低32位是相同的,所以只有一条指令,取低32位 |
整数乘法 | R | mulh rd, rs1, rs3 | 0000001[24-20,rs2][19-15,rs1]001[11-7,rd]0110011 | rd=rs1*rs2, rs1,rs2被当作有符号数,结果高32位写入rd | |
整数乘法 | R | mulhu rd, rs1, rs4 | 0000001[24-20,rs2][19-15,rs1]010[11-7,rd]0110011 | rd=rs1*rs2, rs1,rs2被当作无符号数,结果高32位写入rd | |
整数乘法 | R | mulhsu rd, rs1, rs5 | 0000001[24-20,rs2][19-15,rs1]011[11-7,rd]0110011 | rd=rs1*rs2, rs1当作有符号数,rs2被当作无符号数,结果高32位写入rd |
|
div | 整数除法 | R | div rd, rs1, rs2 | 0000001[24-20,rs2][19-15,rs1]100[11-7,rd]0110011 | rd=rs1/rs2,rs1,rs2都被当作有符号数,将除法的商写回寄存器rd中。 |
整数除法 | R | divu rd, rs1, rs3 | 0000001[24-20,rs2][19-15,rs1]101[11-7,rd]0110011 | rd=rs1/rs2,rs1,rs2都被当作无符号数,将除法的商写回寄存器rd中。 | |
整数除法 | R | rem rd, rs1, rs4 | 0000001[24-20,rs2][19-15,rs1]110[11-7,rd]0110011 | rd=rs1/rs2,rs1,rs2都被当作有符号数,将除法的余数写回寄存器rd中。 | |
整数除法 | R | remu rd, rs1, rs5 | 0000001[24-20,rs2][19-15,rs1]111[11-7,rd]0110011 | rd=rs1/rs2,rs1,rs2都被当作无符号数,将除法的余数写回寄存器rd中。 |
如果希望得到两个32位整数相乘;的完整的64位结果,Risc-V推荐使用下面的指令:
mulh[s|u] rdh,rs1, rs2;
mul rdl rs1,rs2
其中要求:两条指令的源操作数索引号和顺序必须完全相同。第一条指令的rdh索引必须不能与rs1,rs2索引号相同。处理器实现的微架构可以把两条指令融合成一条指令执行,从而提高性能。
如果希望同时得到两个32位数相除的商和余数,Risc-V推荐用以下指令:
div[u] rdq, rs1, rs2;
rem[u] rdr,rs1,rs2;
其中要求:两条指令的源操作数索引号和顺序必须完全相同。第一条指令的rdh索引必须不能与rs1,rs2索引号相同。处理器实现的微架构可以把两条指令融合成一条指令执行,从而提高性能。
Risv-V中除以0,并不会产生异常,仍会产生一个特殊的结果。
RV32M指令集的更多相关文章
- Risc-V指令集
https://riscv.org/specifications/ Risc-V文档包括:用户层指令集文档和特权架构文档,下面这两个文件的官网链接. User-Level ISA Specificat ...
- SSE指令集学习:Compiler Intrinsic
大多数的函数是在库中,Intrinsic Function却内嵌在编译器中(built in to the compiler). 1. Intrinsic Function Intrinsic Fun ...
- ARM-汇编指令集(总结)
ARM汇编指令集 指令.伪指令 (汇编)指令: 是机器码的助记符,经过汇编器编译后,由CPU执行. (汇编)伪指令:用来指导指令执行,是汇编器的产物,最终不会生成机器码. 有两种不同风格的ARM指 ...
- iOS------苹果设备处理器指令集(iPhone初代到iPhone5s)
(via 雅香小筑) Arm处理器,因为其低功耗和小尺寸而闻名,几乎所有的手机处理器都基于arm,其在嵌入式系统中的应用非常广泛,它的性能在同等功耗产品中也很出色. Armv6.armv7.armv7 ...
- SSE指令集优化学习:双线性插值
对SSE的学习总算迈出了第一步,用2天时间对双线性插值的代码进行了优化,现将实现的过程梳理以下,算是对这段学习的一个总结. 1. 什么是SSE 说到SSE,首先要弄清楚的一个概念是SIMD(单指令多数 ...
- RISC指令集的五个周期
RISC指令集的五个周期 RISC(reduced instruction set computer,精简指令集计算机)简称为精简指令集.RISC把执行指令的精力主要放在了经常使用的指令上面.本文主要 ...
- x86指令集同频性能提升
x86近5000条指令,迄今为止最复杂的指令集.这里不研究CISC & RISC,也不考虑process制程变化,主要是看最近几代IA架构对于同频率下性能的提升. x86指令集nasm文档 h ...
- CPU指令集
cpu作为一台电脑中的核心,它的作用是无法替代的.而cpu本身只是在块硅晶片上所集成的超大规模的集成电路,集成的晶体管数量可达到上亿个,是由非常先进复杂的制造工艺制造出来的,拥有相当高的科技含量. C ...
- 在UWP应用中加入Cortana语音指令集
本文介绍小娜语音指令集的使用场景,如何将UWP应用接入小娜的语音指令集,使用户直接通过小娜启动应用并使用应用中 一些轻量级的功能.文中以必应词典作为实例讲解必应词典UWP版本是如何接入小娜语音功能的. ...
随机推荐
- 服务器IO瓶颈对MySQL性能的影响
[背景] 之前我们碰到一些MySQL的性能问题,比如服务器日志备份时可能会导致慢查询增多,一句简单的select或insert语句可能执行几秒,IO负载较高的服务器更容易出现并发线程数升高,CPU上升 ...
- C#简单的通用分页
通用分页技术分析 需要返回不同的类型的数据--采用泛型实现该操作 需要提供不同的方法 上一页 上一页 第一页 最后一页 跳转到指定页 Demo 代码 using System; using Syste ...
- [ 转载 ] Android JNI(一)——NDK与JNI基础
Android JNI(一)——NDK与JNI基础 隔壁老李头 关注 4.4 2018.05.09 17:15* 字数 5481 阅读 11468评论 8喜欢 140 本系列文章如下: Androi ...
- Bzoj4237 cdq分治+树状数组+单调栈
二维平面在某区域内点的问题,要么树套树,kdtree,要么就是cdq分治了.然而这题树套树和kdtree都不是很好搞的样子,于是我们就只能cdq分治了.首先把点按照横坐标x排序,在每一层我们需要算出右 ...
- 「BZOJ 3645」小朋友与二叉树
「BZOJ 3645」小朋友与二叉树 解题思路 令 \(G(x)\) 为关于可选大小集合的生成函数,即 \[ G(x)=\sum[i\in c ] x^i \] 令 \(F(x)\) 第 \(n\) ...
- BZOJ.4456.[ZJOI2016]旅行者(分治 Dijkstra)
题目链接 \(Description\) 给定\(n\times m\)的带边权网格图.\(Q\)次询问从点\((x_i,y_i)\)到点\((x_j,y_j)\)的最短路. \(n\times m\ ...
- jni的一些基础知识和概念
11.1基础知识 JNI(Java Native Interface,JAVA原生接口) 使用JNI可以使Java代码和其他语言写的代码(如C/C++代码)进行交互. 问:为什么要进行交互? |- ...
- Xtreme8.0 - Back to Square 1 数学
Back to Square 1 题目连接: https://www.hackerrank.com/contests/ieeextreme-challenges/challenges/back-to- ...
- Codeforces Round #369 (Div. 2) E. ZS and The Birthday Paradox 数学
E. ZS and The Birthday Paradox 题目连接: http://www.codeforces.com/contest/711/problem/E Description ZS ...
- 给Eclipse安装eUML2插件以及可能出现的依赖错误解决方案(转)
eUML2是一款强大的,基于Eclipse应用程序的UML建模工具.开发者可以在UML开发过程中将模型转化为Java代码:确保软件质量和减少开发时间. 必备条件 Java runtime 1.5 or ...