C/C++中, 浮点数,float以及 double 在内存中是怎样存储的?

假如,我有32-bit
8bit 8bit 8bit 0 0 0 0 0 1 1 1 1

对于整形int,我们可以很快得出,这是 int i = 15的内存形式。
假设,最低位的bit的位权为-1,最高位为30。 那么这个就不再表示数字15了,而是
2^-1+2^0+2^1+2^2 = 7.5 了。

当然,上面只是假设,那么真正的Float 浮点型 在内存中是什么样子的呢?

首先需要知道的是 float 在内存中 占 32-bit double型 占 64-bit。

浮点型 在内存中,有3部分构成。

Sign bit
Exponent (指数)
Mantissa(尾数,有效数字)

sign bit

是指浮点数在内存中的 最高位,0 表示 正数,1 表示负数。Sing bit 在浮点数float,32-bit内存中,占 1-bit 。

Exponent

指数,比如 10^5,2^6,这两个数的 5,6既是exponent。当然,数字在内存中都是以2进制体现的,所以这里的指数,是指以2为底 的指数。比如

0 0 0 0 0 1 1 0

很容易可以知道 Exponent为 6,在表示浮点数的内存中,表示的是 2^6 = 64。
Expoent 在 Float 32-bit的内存中,占8-bit,在这里把此8-bit视为表示unsigned int 的bit pattern。那么可以表示的范围是0~256的整数(指数范围), 但是指数既可以为正整数,也可以为负整数,这样以来无法表示-1,-2....这样的负整数了,所以 IEEE Standard 754 Floating-Point 对此引入了Bias, 偏移量的概念,对于Float型,此偏移量为127. 也就是说 127 这个数字已经被存储到 Exponent这个部分中了,像之前的那个例子,

0 0 0 0 0 1 1 0

表示的是指数6,但是在float内存结构中,其实表示的是 (6-127)= -121。需要减去已存入的偏移量 127。
假如 2^(1),指数1在float 的内存结构中的 bit pattern是什么样子的?
那会不会就是简单的

0 0 0 0 0 0 0 1

应该是 exponent - 127 = 1;(2^(1)中的指数1是这样得来的)
exponent = 127+1 = 128.(2^(1)中的指数1,在float内存结构中应该是128的bit pattern才对)

1 0 0 0 0 0 0 0

这只是个例子,帮助理解exponent,不会真的问这样的问题。。。。

Double型,需要占用64-bit 内存空间。同样,也是由 Sign bit,Exponent,Mantissa 3部分构成,不过 Exponent部分,在整个64-bit中 要占到 11-bit。此外偏移量 为1023。

Mantissa

Mantissa 尾数部分,在float的32-bit的内存空间中,占到23-bit注意之前说的exponent 指数,最低位是从0开始的,那么Mantissa,尾数的最高位当然是 -1了。

0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

那么大家说下,上面的尾数部分在 float 浮点数的内存中,表示多少? 很快可以得到是
2^(-2)+2^(-3) = 0.375。 有错了,应该是1.375。
大家回想下小学学的 科学记数法,5 = 5.0*10^0 , 0.75 = 7.5*10^(-1)。对吧?
在Float的内存表示中,这23-bit的尾数 仅仅表示 科学记数法 中 非零实数小数点后的精度。 换句话说,Mantissa 包括两部分,一个是leading bit(科学记数法的非零实数),另一个是fraction bits(即精度),此23-bit仅仅表示的是 fraction bits。而在二进制中,非零实数自然是1了,所以leading bit默认是1了。所以上述表格实际上是表示

引用
1 + 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

这也就是为什么,在float的内存中,尾数部分可以用23-bit pattern 来表示出24-bit的不同数字了。

在Double型的 64-bit 内存结构中,尾数部分要占到52-bit。

我们用个表格来表示 在内存中,float是怎样存储的。

+/-Sign Exponent 指数 Fraction bit -> .f
s <---------------- 8 ----------------> <-------------------------------------- 23----------------------------->
Unsigned int 2^(-1), 2^(-2), 2^(-3)............

上面这个表格所要 表示的是如下的浮点数
(-1)^s * 1.f * 2^(Exponent-127)

随手写了个32-bit pattern,

0 0 0 0 1 0 1 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
2^8 2^0 2^-23

假如告诉你,这是一个浮点型的内存结构,那么这个浮点数是多少呢?
这个浮点数可以很快的得到 (-1)^0*1.(2^-2+2^-3)*2^(2^1+2^2+2^4-127)。

以上是对Float double 型的内存结构的分析,前面http://chuansu.iteye.com/blog/1484742 提到了int short char之间的相互转化,那么Float Double与int的转化又会发生什么?

首先说一下原,反,补,移码. 移码其实就等于补码,只是符号相反. 对于正数而言,原,反,补码都一样, 对负数而言,反码除符号位外,在原码的基础上按位取反,补码则在反码的基础之上,在其最低位上加1,要求移码时,仍然是先求补码,再改符号.

浮点数分为float和double,分别占4,8个字节,即32,64位. 我仅以32位的float为例,并附带说double.

在IEEE754标准中,规定,float的32位这样分:

符号位(S)

1

阶码(E)

8

尾数(M)

23

这里应该注意三点:   A,阶码是用移码表示的,这里会有一个127的偏移量,它的127相当于0,小于127时为负,大于127时为正,比如:10000001表示指数为129-127=2,表示真值为2^2,而01111110则表示2^(-1).

B, 尾数全都是小数点后面的数,

C, 但尾数中省略了一个1,因此尾数全为0时,也是1.0...00;

接下来只要说明几个问题就明白了,以123.456为例,表示为二进制就是:N (2) = 1111011. 01110100101111001 ,这里,会右移6位,得到N (2) = 1.111011 01110100101111001*2^6; 这种形式就可以用于上图中的表示格式了.

符号位(S)

0

阶码(E) 00000110

尾数(M)11101101110100101111001

注意到,上面的阶码第一位为0表正,尾数比N(2)表示的第一位少了个1,这就是上面说的默认为第一位为1. 由于在将十进制转为二进制的过程中,常常不能正好转得相等, (当然,像4.0这样的就不会有损失,而1.0/3.0这样的必然损失),所以就产生了浮点数的精度问题, 实际上,小数点后的23位二进制数,能影响的十进制数的前8位,这是为什么呢?一般人在这时往往迷迷胡胡了,其实很简单,在上面表示的尾数中,是二进制 的,小数点后有23位,最后一位的值为1时,它就是1/2^22=0.000000238实际取的时候肯定是0.0000002,也就是说,对于一个 float型的浮点数,其有效的位数是从左到右数7位(包括缺省的1才是7位),当到达上面这个第8位时,就不可靠了,但我们的VC6可以输出最长的 1.0/3.0为0.33333333333333331,这主要是编译器的问题了, 而并不是说浮点数小数点后的16位都有效. 如果不信的话,可以去试一下double类型的1.0/3.0, 得到的也将是小数点后17 位.                                                                                                  ..另外,编译器或电路板一般都有"去噪声"的"修正"能力,它能够使得超过7位的十进制数即使无效了也不会变得离谱,这也是上面为什么一直都是输出 333而不是345之类的,. 可以这样试一下:

float f=123456789;  cout<<f<<endl;//这里肯定得到123456789.

这里有一个被人遗忘的问题,就是10进制小数怎么变为2进制小数,其实很简单,就是将10进的小数部分不断乘以2,进位时就将对应的2进制位写入1. 因此将上面的N (2) = 1.111011 01110100101111001*2^6;再转回十进制数时,很可能已经不再是123.456了. 好,精度问题应该说清楚了. 下面说示数范围.

阶码的示数位数是8位移码, 最大为127最小为-127,这里的127用来作为2的指数,因此为2^127,约等于 1.7014*10^38, 而我们知道,float的示数范围约为-3.4*10^38-------3.4*10^38, 这是因为尾数的24位(默认第一位为1)全为1是,非常接近2,  1.11..11很明显约为2,因此浮点数的范围就出来了.

double的情况与float完全相似,只是它的内在形式是

符号位(S)

1

阶码(E)

11

尾数(M)

52

主要的区别在于它的阶码有11位了, 这就有2^1023约等于 0.8572*10^308, 尾数53位约为2,故double的示数范围约为 -1.7*10^308.------1.7*10^308.  至于其精度,同样,1.0/2^51=4.4*10^(-16).小数点后15位有效,加上缺省的那一位,因此对于double浮点数,从左到右的16位 数都是可靠的.

有时,我们会听到"定点小数"这个词,单片机(如手机等)一般只使用定点数,迷糊的时候,我们会以为 float  a=23.4; 这种是定点小数, float a=2.34E1这种为浮点数,其实这是错误的, 上面只是同一个浮点数的不同表示,都是浮点数. 定点小数是有这种提法,认为整就是定点小数,小数点定在个位后面,小数部分为0.也可认为纯小数是定点小数,但它只能表示小于1的纯小数.

然后再说一下C/C++中的几个函数, C++中默认输出小数点后的5位小数,但可以设置,有两种方法:调用setpression或者使用cout.pression,但效果是不同的:

float mm=123.456789f;  cout<<mm<<endl;  //123.457           虽说默认为不数点后5位,但只是整数部分只有一位才这样.  setprecision(10);                               //设置小数点后的位数,但当整数部分有两位时,与默认情况没什么两样,不起作用.  cout<<mm<<endl;  //123.457  cout.precision(4);                              //设置总的位数.  cout<<mm<<endl;  //123.4     总之效果是比较怪的,个人认为虽然这样显得不够确定,但实为硬件系统所限.无可厚非.

对于0的实际表示,有人认为+0一般能绝对为0,而-0则可能表示一个极小的数.  为此,本人想到了一种很好的验证办法,证明了不管+0还是-0,它都是2^(-127),代码如下:

float fDigital = 0.0f;         unsigned long nMem;// 临时变量,用于存储浮点数的内存数据  // 将内存按位复制到临时变中,以便取用,此时的nMem并不等于fDigital了,它是按位复制的。  nMem = *(unsigned long*)&fDigital;  cout<<nMem<<endl;  //一般得到一个很大的整数.

bitset<32>mybit(nMem);//妙在此处,这里的输出就是32float的内存表示了.终于完全直观地看到了.  cout<<mybit<<endl;   //00000000000000000000000000000000 用-0.0来试,也是如此.

如果你还认为上面那一长串的0表示的是绝对的0,那么请重新看本文. 事实上,本人的这种做法是比较巧妙的,将上面的fDigital用任何其它浮点数表示,这个bitset数都可以反映出它的内存表示.

有移码表示阶码有是有原因的,主要是移码便于对阶操作,从而比较两个浮点数的大小. 这里要注意的是,阶码不能达到11111111的形式,IEEE规定,当编译器遇到阶码为0XFF时,即调用溢出指令.  总之,阶码化为整数时,范围是:-127~127.

最后,有一个往往高手也汗颜的地方,一定要记住,浮点数没有无符号型的usinged float/double是错误的.

本人才疏学浅,欢迎批评指正.

C中的Float分析的更多相关文章

  1. C#和C++中的float类型

    博客搬到了fresky.github.io - Dawei XU,请各位看官挪步.最新的一篇是:C#和C++中的float类型.

  2. Android中AppWidget的分析与应用:AppWidgetProvider .

    from: http://blog.csdn.net/thl789/article/details/7887968 本文从开发AppWidgetProvider角度出发,看一个AppWidgetPrv ...

  3. 关于SQL中数据类型(float和real)和 .NET Framework 中数据类型(float和double)的问题

    今天同学写程序遇到一个问题,MSSQL里的数据是 float 类型,在 .NET Framework 中用的时候也转换成 float 类型,结果报错,类型转换异常,明明是相同的类型,为什么会异常 在w ...

  4. java中int,float,long,double取值范围,内存泄露

    java中int,float,long,double取值范围是多少? 写道 public class TestOutOfBound { public static void main(String[] ...

  5. C#中对于float,double,decimal的误解

    原文:C#中对于float,double,decimal的误解 一直很奇怪C#的预定义数据类型中为什么加了一个decimal,有float和double不就够了吗?今天来挖一挖. 浮点型 如果我们在代 ...

  6. JAVA WEB 中的编码分析

    JAVA WEB 中的编码分析 */--> pre.src {background-color: #292b2e; color: #b2b2b2;} pre.src {background-co ...

  7. Android 中图片压缩分析(上)

    作者: shawnzhao,QQ音乐技术团队一员 一.前言 在 Android 中进行图片压缩是非常常见的开发场景,主要的压缩方法有两种:其一是质量压缩,其二是下采样压缩. 前者是在不改变图片尺寸的情 ...

  8. 《构建之法》教学笔记——Python中的效能分析与几个问题

    <构建之法:现代软件工程>中第2章对效能分析进行了介绍,基于的工具是VSTS.由于我教授的学生中只有部分同学选修了C#,若采用书中例子讲解,学生可能理解起来比较困难.不过所有这些学生都学习 ...

  9. Apollo配置中心源码分析

    Apollo配置中心源码分析 1. apollo的核心代码分享 SpringApplication启动的关键步骤 在SpringApplication中,会加载所有实现了Init方法的类 protec ...

随机推荐

  1. SQL Server代理警报

    使用SQL Server代理警报的前提条件1.创建操作员,接收消息的用户2.创建警报,满足某种条件触发警报,并作出响应(执行作业或/和通知操作员)3.配置数据库邮件,用于发送消息通知4.SQL Ser ...

  2. How to use PEM of PPAS

    -bash-4.1$ pwd/opt/PostgresPlus/9.3AS/client-v4/scripts -bash-4.1$ lsclient launchPEMClient.sh -bash ...

  3. 从出租车司机到大BOSS的转型之路

    来深圳之前,曾有人这样告诉我:在深圳千万不能以貌取人,打扮不起眼,也许他转身开的座驾就是宝马.奔驰;不管一个人多么邋遢俗气,也别瞧不起人家,也许他的手提袋里就是成捆的人民币现金;不管一个人打扮的多么土 ...

  4. .NET开发实战1-军队未出,粮草先行。

    马上期末考试了,会想起这个学习的自己.一直都在一个人搞java的研究,C#课也没怎么去上.所以在这里想弥补一下自己没去上课的原因,也希望老师能够理解这个还在迷茫的我. 正所谓,军队未出粮草先行,所以我 ...

  5. 各大Oj平台介绍 刷题平台

    https://leetcode.com/ http://www.cnblogs.com/lzmfywz/archive/2012/02/07/2342010.html 1.题库与网站资源题库-在线提 ...

  6. Qt信号与槽应用实例一

    ..... connect(m_pGlobelWidget,signal(globeControlClick(object,object)),this,slot(globeControlClick(o ...

  7. [3] 智能指针std::auto_ptr

    [1]std::auto_ptr 对于编译器来说,智能指针实质是一个栈对象,而并非指针类型. 智能指针通过构造函数获取堆内存的管理所有权,而在其生命期结束时,再通过析构函数释放由它所管理的堆内存. 所 ...

  8. [课程设计]Scrum 1. 8多鱼点餐系统开发进度(完善整个订餐页面工作)

    [课程设计]Scrum 1. 8多鱼点餐系统开发进度(完善整个订餐页面工作) 1.团队名称:重案组 2.团队目标:长期经营,积累客户充分准备,伺机而行 3.团队口号:矢志不渝,追求完美 4.团队选题: ...

  9. 关于ORACLE隐式转换后性能问题

    SELECT TM.MONEY_CODE FROM T_CONTRACT_MASTER T,T_MONEY TM WHERE T.MONEY_ID = TM.MONEY_ID AND T.POLICY ...

  10. pickle与shelve

    pickle Example 写入文件 import pickle integers = [1, 2, 3, 4, 5] with open('pickle-example.p', 'wb') as ...