电子科技大学 - 计算机组成原理

小数的十进制和二进制转换

移码

定义:[X] = X + 2n ( -2n ≤ X < 2n )
X为真值,n为整数的位数

数值位和X的补码相同,符号位与补码相反

舍入方法

0舍1入

保留4位尾数:
0 00100 -> 0 0010
/*
**0直接舍去
*/
1 00101 -> 1 0011
/*
**1进位
*/
1 11011 -> 1 1110

末位恒置1

保留4位尾数:
0 00100 -> 0 0011
1 00101 -> 1 0011
1 11011 -> 1 1101

IEEE 754

32位单精度

Sign 8位阶码 [偏移量为28-1-1 = 127的非标准移码] 23位尾数
真值表达式 E的取值范围
N = (-1)s × 2E-127 × 1.M 1到254

64位双精度

Sign 11位阶码 [偏移量为211-1-1 =1023的非标准移码] 252位尾数
真值表达式 E的取值范围
N = (-1)s × 2E-1023 × 1.M 1到2046

为了确保浮点数表示的唯一性,约定 0 ≤ M < 1

各字段的含义( 以单精度为例 )

规范浮点数

1 ≤ E ≤ 254

真值表达式:N = (-1)s × 2E-127 × 1.M,尾数部分隐含开头的1

  • 最小的正规格化数
0 0000 0001 0000 0000 0000 0000 0000 000
  • 最大的正规格化数
0 1111 1110 1111 1111 1111 1111 1111 111

非规范浮点数

E = 0,M ≠ 0

s 0000 0000 ≠ 0

真值表达式:N = (-1)s × 2-126 × 0.M,尾数部分不隐含开头的1

最小的正非规格化数

s 0000 0000 0000 0000 0000 0000 0000 001

最大的正非规格化数

s 0000 0000 1111 1111 1111 1111 1111 111

浮点数0

E = 0,M = 0

s 0000 0000 0000 0000 0000 0000 0000 000

有+0.0和-0.0两种零

无穷大

E全为1(255),M = 0

正无穷大

0 1111 1111 0000 0000 0000 0000 0000 000

负无穷大

1 1111 1111 0000 0000 0000 0000 0000 000

NaN Not a Number

计算sqrt(-1)或∞-∞时会返回NaN

E全为1(255),M ≠ 0

s 1111 1111 ≠ 0

为什么要使用127作为偏移量而不是128


https://stackoverflow.com/questions/8909841/why-does-the-ieee-754-standard-use-a-127-bias

溢出

上溢:阶码大于机器的最大阶码,不能继续运算,一般要进行中断处理

下溢:阶码小于最小阶码,当做零处理,机器可以继续运算

规格化浮点数

  • 当尾数结果为00.0x…x 或 11.1x…x
    尾数左移,阶码减1,直到尾数形式为00.1x…x 或 11.0x…x

  • 当尾数结果为01.x…x 或 10.x…x
    尾数右移,阶码加1,尾数形式变为00.1x…x 或 11.0x…x

阶码加减

设:
AE、BE为阶码,CE为结果阶码

[ AE + BE ]
= ( AE + BE ) + 127
= ( AE + 127 ) + ( BE + 127 ) - 127
= [ AE ] + [ BE ] -127
= [ AE ] + [ BE ] + [ -127 ]
= [AE] + [BE] + 129

= ( [AE] + [BE] + 129 ) mod 28

[ AE - BE ]
= ( AE - BE ) + 127
= ( AE + 127 ) - ( BE + 127 ) + 127
= [ AE ] - [ BE ] + 127

= ( [AE] - [BE] + 127 ) mod 28

浮点数加减

设:
A = 2AE × AM,B = 2BE × BM
AE、BE为阶码,AM、BM为尾数

舍入

右移时:

  • 0舍1入
  • 末位恒置1

例题

x = 0.5, y = 0.4375, 32位单精度表示,求x + y和x - y

转换为二进制

  1. 0.5 x 2 = 1.0 取1

0.1 → 1.0 x 2 -1
[x] =

0 0111 1110 0000 0000 0000 0000 0000 000
-1 + 127 = 126
  1. 0.4375 x 2 = 0.875 取0
  2. 0.8750 x 2 = 1.750 取1
  3. 0.7500 x 2 = 1.500 取1
  4. 0.5000 x 2 = 1.000 取1

-0.0111 → 1.11 x 2-2

[y] =

1 0111 1101 1100 0000 0000 0000 0000 000
-2 + 127 = 125

求阶差

(0111 1110 - 0111 1101 + 127)mod 28 = 1
y向x对齐
y = 0.111 x 2-1
[y] =

1 0111 1110 1110 0000 0000 0000 0000 000

尾数加减

+
00.0000 0000 0000 0000 0000 000
00.0010 0000 0000 0000 0000 000
00.0010 0000 0000 0000 0000 000

结果为00.0x…x,左规
得到1.0… x 2-4

结果 = 0.0625

0 0111 1011 0000 0000 0000 0000 0000 000
-4 + 127 = 123
-
00.0000 0000 0000 0000 0000 000
00.1110 0000 0000 0000 0000 000
00.1110 0000 0000 0000 0000 000

结果 = 0.9345

0 0111 1110 1110 0000 0000 0000 0000 000

IEEE 754 浮点数加减运算的更多相关文章

  1. IEEE 754 浮点数在计算机中的表示方法

    IEEE二进制浮点数算术标准(IEEE 754)是20世纪80年代以来最广泛使用的浮点数运算标准,为许多CPU与浮点运算器所采用.这个标准定义了表示浮点数的格式(包括负零-0)与反常值(denorma ...

  2. velocity加减运算注意格式 ,加减号的左右都要有空格

    velocity加减运算注意格式 ,加减号的左右都要有空格 #set( $left= $!biz.value - $vMUtils.getReturnMoney($!biz.billBuy) )

  3. [Swift]LeetCode592. 分数加减运算 | Fraction Addition and Subtraction

    Given a string representing an expression of fraction addition and subtraction, you need to return t ...

  4. C语言中指针变量的加减运算

    1.指针变量中存放的是地址值,也就是一个数字地址,例如某指针变量中的值是0x20000000,表示表示此指针变量存放的是内存中位于0x20000000地方的内存地址.指针变量可以加减,但是只能与整型数 ...

  5. 大整数加减运算的C语言实现

    目录 大整数加减运算的C语言实现 一. 问题提出 二. 代码实现 三. 效果验证 大整数加减运算的C语言实现 标签: 大整数加减 C 一. 问题提出 培训老师给出一个题目:用C语言实现一个大整数计算器 ...

  6. Linux中日期的加减运算

    Linux中日期的加减运算 目录 在显示方面 在设定时间方面 时间的加减 正文 date命令本身提供了日期的加减运算. date 可以用来显示或设定系统的日期与时间. 回到顶部 在显示方面 使用者可以 ...

  7. void *指针的加减运算

    1.手工写了一个程序验证void *指针加减运算移动几个字节: //本程序验证空类型指针减1移动几个字节 #include <stdio.h> int main(int argc, cha ...

  8. Leetcode 592.分数加减运算

    分数加减运算 给定一个表示分数加减运算表达式的字符串,你需要返回一个字符串形式的计算结果. 这个结果应该是不可约分的分数,即最简分数. 如果最终结果是一个整数,例如 2,你需要将它转换成分数形式,其分 ...

  9. C语言中指针的加减运算

    参考文章,值得一看 char arr[3]; printf("arr:\n%d\n%d\n%d\n", arr, arr + 1, arr + 2); char *parr[3]; ...

随机推荐

  1. java对象的引用级别

    解释 在java中也有引用的概念,其实就可以认为是变量.标题中的引用级别是指变量与对象之前的引用级别.java中分为4种,按引用强弱关系排序分别是:强引用.软引用.弱引用.虚引用. 强引用(Stron ...

  2. Java变量命名规范

    java命名规范 所有方法.变量.类名:见名知意 类成员变量:首字母小写.驼峰原则: 例如:lastName 第一个单词首字母小写,其余首字母大写 局部变量:首字母小写.驼峰原则 类名: 首字母小写. ...

  3. PyPDF2.py 合并pdf时报错问题

    报错如下: Traceback (most recent call last): File "./pdf_merge.py", line 68, in <module> ...

  4. IOS 集成 Bilibili IJKPlayer播放器,播放rtmp视频流

    因为公司项目需要,我一个连iPhone都没用过的人竟然跑去开发iOS APP.近一段时间一直忙于赶项目,到今天差不多了,所以记录一下当时遇到的各种坑,先从ios 集成 ijkplayer播放器说起! ...

  5. 性能测试必备命令(1)- free

    性能测试必备的 Linux 命令系列,可以看下面链接的文章哦 https://www.cnblogs.com/poloyy/category/1819490.html 介绍 显示系统的内存使用情况 语 ...

  6. 硕盟 type-c转接头转接口(HDMI+VGA+USB3.0+PD3.0)四合一拓展坞

    硕盟SM-T54是一款 TYPE C转HDMI+VGA+USB3.0+PD3.0四合一多功能扩展坞,支持四口同时使用,您可以将含有USB 3.1协议的电脑主机,通过此产品连接到具有HDMI或VGA的显 ...

  7. 聊一聊开闭原则(OCP).

    目录 简述 最早提出(梅耶开闭原则) 重新定义(多态开闭原则) 深入探讨 OCP的两个特点 对外扩展开放(Open for extension) 对内修改关闭 抽象 关闭修改.对外扩展? 简述 在面向 ...

  8. 深度探索-Redis复制

    1.前言 本文介绍了Redis复制的主要流程和设计思想.通过本文的阅读,您大致能理解复制在软件架构方面的通用思想.在阅读本文之前,希望读者首先对Redis有一定的认识,对Redis的事件类型.和事件处 ...

  9. python 爬虫新手入门教程

    python 爬虫新手教程 一.什么是爬虫 爬虫就是把一个网站里的内容读取下来 这里我们就要学习一个知识 我们看到的网页是有一种叫HTML的语言编写的 他可以给文字显示不同的样式 如:<p> ...

  10. js设计模式之发布订阅模式

    1. 定义 发布-订阅模式其实是一种对象间一对多的依赖关系,当一个对象的状态发送改变时,所有依赖于它的对象都将得到状态改变的通知. 订阅者(Subscriber)把自己想订阅的事件注册(Subscri ...