IEEE浮点数标准

阅读笔记:Computer System : A Programmmer's Perspective

基本概念

IEEE浮点数标准采用

\[V=(-1)^s\times M\times2^E
\]

的形式表示一个数:

  • 符号:s决定数的正负

  • 尾数:M是一个二进制小数,范围是1~2-epsilon 或者 0~1-epsilon

  • 阶码:E的作用是对浮点数加权,权重为2的E次幂

下图为单精度(32位)与双精度(64位)的位示意图:

单精度:

  • s:1位
  • exp:k=8位
  • frac:n=23位

双精度:

  • s:1位
  • exp:k=11位
  • frac:n=52位

三个字段的编码:

  1. 单独的s直接编码符号s

  2. k位的阶码字段:

    \[exp=e_{k-1}e_{k-2}\cdots e_{1}e_{0}
    \]

编码E

  1. n位的小数字段:
    \[frac=f_{n-1}f_{n-1}\cdots f_{1}f_{0}
    \]

编码M

编码的三种情况

规范化值

当exp的位即不全为0也不全为1时(即单精度范围:1~254 双精度范围:1~2046),即为规范化的值。这种情况下,阶码字段可以被解释为以偏置量(bias)形式表示的有符号整数

\[E=exp-bias
\]

其中:exp即为阶码字段表示的值,并有

\[bias=2^{k-1}-1
\]

故对于单精度bias=127,双精度bias=1023,由此可得:

\[E=exp-127
\]

或者是:

\[E=exp-1023
\]

因此指数的范围:

\[E\in [-126,127]
\]

或者是:

\[E\in [-1022,1023]
\]

小数字段被解释为描述小数值f,0≤f<1,即:

\[f=\sum_{i=0}^{n-1}f_i*2^{i-n}
\]

尾数定义为:

\[M=1+f
\]

非规范化值

当阶码域全为0时,表示的数是非规范化的,此时的阶码为

\[E=1-bias
\]

故E=-126(单精度)或者E=-1022(双精度)而尾数:

\[M=f
\]

同理0≤f<1,即:

\[f=\sum_{i=0}^{n-1}f_i*2^{i-n}
\]

用途:

  • 表示数值0
  • 表示非常接近0的数

特殊值

  1. 无穷大

阶码全为1且小数字段全为0,根据符号位表示±∞

  1. NaN

阶码全为1且小数字段不全为0,这不是一个数(Not a Number)

总结

值的表示:

\[V=(-1)^s\times M\times2^E
\]

单精度:

  1. 规范值:

    E=exp-bias

    bias=127

    M=1+f

  2. 非规范:

    E=1-bias=-126

    bias=127

    M=f

双精度:

  1. 规范值:

    E=exp-bias

    bias=1023

    M=1+f

  2. 非规范值

    E=1-bias=-1022

    bias=1023

    M=f

示例

Q1.将-3.33333333转换为单精度表示

首先,将这个小数转化为二进制的小数形式(利用×2法)

\[-3.33333333_{10}=-11.010101010101..._{2}
\]

规范化:

\[-3.33333333_{10}=-1.1010101010101..._{2}\times2^1
\]

因此:

\[s=1
\]
\[exp=E+bias=1+127=128_{10}=1000 0000_{2}
\]
\[M=1.1010101010..._2\Rightarrow f=1010101010..._2
\]

从而可以写出单精度表示

\[11000000010101010101010101010101_2=C0555555_{16}
\]

Q2.给出如图8位二进制数在IEEE标准的浮点格式

首先对于规范化值:

\[E=exp-bias=exp-7
\]

对于非规范值:

\[E=1-bias=-6
\]

可以写出如下表格:

IEEE浮点数标准的更多相关文章

  1. 浮点数在计算机中的表示(IEEE浮点数标准)

    转载自:https://wdxtub.com/2016/04/16/thin-csapp-1/

  2. 基于 IEEE 754 标准的 单精度浮点数计算方式 (未完成)

    def dec2bin(dec): if dec < 0: s = ' dec = dec * (-1) else: s = ' e = 127 dec = float(dec) r = int ...

  3. 打印一个浮点数组,会输出字符串"Hello, world“ & 浮点数的二进制表示(IEEE 754标准)

    #include <stdio.h> #include<stdlib.h> int main() { float a[3] = { 1143139122437582505939 ...

  4. 【算法】解析IEEE 754 标准

    目录结构: contents structure [-] 浮点数的存储过程 次正规数(Denormalized Number) 零(zero) 非数值(NaN) 无穷大(infinity) 除数为0. ...

  5. python 警惕 IEEE 754标准

    双精度浮点数格式,即IEEE 754标准 >>> 0.1+0.2 0.30000000000000004 >>> (0.1+0.2)==0.3 False > ...

  6. IEEE 754标准--维基百科

    IEEE二进制浮点数算术标准(IEEE 754) 是20世纪80年代以来最广泛使用的浮点数运算标准,为许多CPU与浮点运算器所采用.这个标准定义了表示浮点数的格式(包括负零-0)与反常值(denorm ...

  7. 计算机中如何表示数字-07IEEE754浮点数标准

    由于不同机器所选用的基数.尾数位长度和阶码位长度不同,因此对浮点数的表示有较大差别,这不利于软件在不同计算机之间的移植.为此,美国IEEE(电器及电子工程师协会)提出了一个从系统角度支持浮点数的表示方 ...

  8. IEEE浮点数float、double的存储结构

    众所周知,C的float.VB的Single都是32位浮点数变量类型(也叫单精度浮点数),C的double和VB的Double则都是64位的浮点数变量类型(也叫双精度浮点数).有些编译器还支持更屌的l ...

  9. IEEE 754标准

    IEEE 754-1985 was an industry standard for representing floating-point numbers in computers, officia ...

随机推荐

  1. 手写Express.js源码

    上一篇文章我们讲了怎么用Node.js原生API来写一个web服务器,虽然代码比较丑,但是基本功能还是有的.但是一般我们不会直接用原生API来写,而是借助框架来做,比如本文要讲的Express.通过上 ...

  2. 4G工业路由器的信号强度应该怎么保证呢?

    在M2M无线方面,最薄弱的环节是差的间歇性的信号强度.低信号电平导致系统性能差,响应时间慢和可靠性问题.对于系统安装人员和其他4G工业路由器供应商,如何确保最佳的蜂窝信号强度? 检查2G/3G/4G信 ...

  3. 基于Django的图书推荐系统和论坛

    基于Django的图书推荐系统和论坛 关注公众号"轻松学编程"回复"图书系统"获取源码 一.基本功能 登录注册页面 基于协同过滤的图书的分类,排序,搜索,打分功 ...

  4. MyBatis重要核心概念

    一.SqlSessionFactoryBuilder 从命名上可以看出,这个是一个 Builder 模式的,用于创建 SqlSessionFactory 的类.SqlSessionFactoryBui ...

  5. 安装jdk及安装多版本jdk

    目录 由于要使用多个版本jdk,所以看下如何在一台电脑安装多个版本jdk 当然,如果你只需要安装一个jdk,本文也适合你,只需要在JAVA_HOME值填你jdk安装的目录即可 一.首先安装好不同的jd ...

  6. 实用fork/join框架提升程序效率

    实用fork/join框架提成程序效率 原文地址:https://www.jianshu.com/p/9ce243796d4a 业务场景 最近再做一个接口,我是一个中央的消息接受方,当我接受到消息后要 ...

  7. 快速傅里叶变换(FFT)学习笔记(其二)(NTT)

    再探快速傅里叶变换(FFT)学习笔记(其二)(NTT) 目录 再探快速傅里叶变换(FFT)学习笔记(其二)(NTT) 写在前面 一些约定 前置知识 同余类和剩余系 欧拉定理 阶 原根 求原根 NTT ...

  8. 2.1 自定义日志系统-log4net

    说明 Prism中如果把日志级别设定为DEBUG,会显示框架加载信息 Prism默认是没有日志系统的 步骤 下载log4net包 Install-Package log4net; 在app.confi ...

  9. C++ 数据结构 1:线性表

    1 数据结构 1.1 数据结构中基本概念 数据:程序的操作对象,用于描述客观事物. 数据的特点: 可以输入到计算机 可以被计算机程序处理 数据是一个抽象的概念,将其进行分类后得到程序设计语言中的类型. ...

  10. Spark Standalone模式 高可用部署

      本文使用Spark的版本为:spark-2.4.0-bin-hadoop2.7.tgz. spark的集群采用3台机器进行搭建,机器分别是server01,server02,server03. 其 ...