【小思考】Python的float转换精度损失所想到的

首先，为啥会要讨论这个问题。

我得为昨天拖了小组后腿深表歉意。其实程序逻辑很快就理通了的，但自己总是会因为各种各样的小问题束缚手脚，看接下来这个图片：

稍微有数据敏感性的同学就能看出，中间这么一大堆又是0000又是999还是这么多位的小数，一看就是异常数据。这块数据的产生，源于代码里对两个字符串做了float转换并相减，导致出现了这种数据异常的错误。那么问题来了，1.这种异常是如何产生的？2.有哪些方法可以解决这种问题呢？3.编程中间还有哪些与这个问题相关的注意事项呢？

第一部分：这种异常是如何产生的呢？

我们先来看演示：

看来，直接输出float型数据，以及对字符串进行的float转换，本身并没有什么问题，那么为什么浮点数相减就会出现这个可恶的小尾巴呢？我们有必要从计算机本身数字加减的机制进行探究。有学习过《计算机组成原理》等基本课程、哪怕只是简单了解计算机内部运行机制的同学都明白，计算机内部的加减乘除都是要把数字转化成为二进制实现的。那么，我们此处的浮点数，也要转换为二进制，才能进行计算。Python内浮点数是用机器上浮点数的本机双精度(64 bit)表示的。提供大约17位的精度和范围从-308到308的指数。和C语言里面的double类型相同【可参考C语言double类型的解释】。

我们来看一个简单的例子。十进制1.1转换成二进制是什么数？十进制整数部分转化成二进制，用短除法处以2倒序取余。小数部分转化为二进制是用乘法乘2正序取整。见下面一个浮点数转二进制数的例子。

1.10整数部分就是1，转换成二进制1（这里整数转二进制不再赘述）
小数部分：0.1
0.1*2=0.2取整数部分0，基数=0.2
0.2*2=0.4取整数部分0，基数=0.4
0.4*2=0.8取整数部分0，基数=0.8
0.8*2=1.6取整数部分1，基数=1.6-1=0.6
0.6*2=1.2取整数部分1，基数=1.2-1=0.2
0.2*2=0.4取整数部分0，基数=0.4
.
.
.
直至基数为0。1.1用二进制表示为：1.000110...xxxx....(后面表示省略)

关于之前的演示，相当于，因为3.4的存储，发生了精度损失（3.5不会，因为3.5的二进制是11.1，补码存储依然不会发生精度损失），所以在相减的时候，发生了一次精度损失，最后结果存储的时候，再次发生一次精度损失。所以，才会出现最后的小尾巴情况。

第二部分：有哪些方法可以解决这个问题呢？

解决这个问题？不存在的，除非是提高精度——让计算机内能够完整的存储数字的二进制（二进制补码）表示，否则的话，只要有精度损失，就指不定什么时候会冒出来小尾巴。我们追求的解决，自然也是从提高精度，和“表面看起来正确”这两条道路去追求。

提高精度——Python本身自带的float已经是可支持浮点数的最高精度形式。当然，这个肯定是不能阻挡我们对更高精度的要求，这里可以自己实现高精度的数据形式，也可以使用Python扩展模块：Decimal。使用Decimal本身需要导入decimal包，初始化decimal数据可以使用整型数据和字符串，而不能使用float型数据，正如之前我们所说的那样，某些浮点数存储会发生精度损失——这意味着float本身就不够精确。

当然，还有很多抖机灵的方法，比如说结果转换成字符串然后再截取？！

你可能体会不到，这个是一种针对数据波动范围相对确定，相当实用的方法——虽然应该没有任何一个脑子正常的程序员会推崇这种方法。这种方法就是追求的“表面上看起来正确”，你看，最后的显示出来的结果不就是-0.1么？

自然，还有print的%精度控制，这里就不赘述。而且也不想详述这个，毕竟这个惊为天人的字符串截取方法，都还是对字符串进行了处理，而%精度控制只是显示的时候做了处理，可真是够“表面”的。

不得不说，也是受这种方法的启发，本人使用的方法，是利用Python int转换“舍去小数点后所有数字”的特点，把原浮点数乘以需要保留精度的位数，然后转换成整数，再除回去，这样就形成了“表面正确”的数据，效果不要太好。

总结一下！解决这个精度损失带来的“恶魔小尾巴”问题，我们大体上有提高数据格式精度和只追求最终显示改变两大思路。

提高数据格式精度：使用扩展包decimal

只追求最终显示改变：printf %精度控制，字符串截取指定位数，先移动小数点、转换成整型舍去末尾、再把小数点移动回来。等方法。

第三部分：编程中间还有哪些和这个问题相关的注意事项呢？

这个小尾巴让我可谓一开始是焦头烂额，也严重耽误了小组研究进度。通过我们之前的探究，可以发现，浮点数本身表示由于受计算机限制，经常是不精确的。所以，日常数据中，最好不要用浮点数。

可能有些人觉得精度损失一些没有什么，然而浮点数的精度损失关键时候可不只只是精度损失，甚至会影响流程控制！浮点数不只有Python里面有，咱们用更加基本的C++来说明这个问题：

当精度损失已经让程序的走向开始不符合逻辑的时候，你还会轻视这个问题么？

这里给广大同仁们分享一篇专门讲解浮点数的文章，深入了解，真的有很多可圈可点之处！

深入了解计算机浮点数机制——程序员必备！

【小思考】Python的float转换精度损失所想到的的更多相关文章

Python之☞float浮点数精度问题
Python的浮点数损失精度问题(转) 一个简单的面试题: >>>0.1+0.1+0.1 0.2 >>>0.1+0.1+0.1 0.3000000000000000 ...
java学习笔记（3）数据类型、源码、反码、补码、精度损失、基本数据类型互相转换
关于java中的数据类型: 1.数据类型的作用是什么? 程序当中有很多数据,每一个数据都是有相关类型的,不同数据类型的数据占用的空间大小不同. 数据类型的作用是指导java虚拟机(JVM)在运行程序的 ...
WebGL着色器32位浮点数精度损失问题
问题 WebGL浮点数精度最大的问题是就是因为js是64位精度的,js往着色器里面穿的时候只能是32位浮点数,有效数是8位,精度丢失比较严重. 这篇文章里讲了一些处理方式,但是视坐标这种方式放在我们的 ...
Java中关于 BigDecimal 的一个导致double精度损失的"bug"
背景在博客恶心的0.5四舍五入问题一文中看到一个关于 0.5 不能正确的四舍五入的问题.主要说的是 double 转换到 BigDecimal 后,进行四舍五入得不到正确的结果: public ...
Java double和 float丢失精度问题
详见:http://blog.yemou.net/article/query/info/tytfjhfascvhzxcyt357 由于对float或double 的使用不当,可能会出现精度丢失的问题. ...
java float double精度为什么会丢失？浅谈java的浮点数精度问题【转】
由于对float或double 的使用不当,可能会出现精度丢失的问题.问题大概情况可以通过如下代码理解: public class FloatDoubleTest { public static vo ...
double float的精度问题
三部曲 1: #include <iostream> #include <stdio.h> #include <string.h> using namespace ...
Java中的小数运算与精度损失
float.double类型的问题我们都知道,计算机是使用二进制存储数据的.而平常生活中,大多数情况下我们都是使用的十进制,因此计算机显示给我们看的内容大多数也是十进制的,这就使得很多时候数据需要在 ...
JAVA浮点数计算精度损失底层原理与解决方案
浮点数会有精度损失这个在上大学的时候就已经被告知,但是至今完全没有想明白其中的原由,老师讲的时候也是一笔带过的,自己也没有好好琢磨.终于在工作的时候碰到了,于是google了一番. 问题: 对两个do ...

随机推荐

微信网页动画---swiper.animate.css
项目需要,自己写了个demo <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> ...
#import 指令
[#import 指令] #import指令用于从一个类型库中结合信息.该类型库的内容被转换为C++类,主要用于描述COM界面. 语法 #import "文件名" [属性] #im ...
mysql的force index
MSQL中使用order by 有个坑,会默认走order by 后面的索引.而不走where条件里应该走的索引.大家在使用时要绕过此坑. 如下语句因为order by 走了settle_id这个主键 ...
用phpUnit入门TDD
用phpunit实战TDD系列从一个银行账户开始假设你已经安装了phpunit. 我们从一个简单的银行账户的例子开始了解TDD(Test-Driven-Development)的思想. 在工程目 ...
Linux查看日志三种命令
第一种:查看实时变化的日志(比较吃内存) 最常用的: tail -f filename (默认最后10行,相当于增加参数 -n 10) Ctrl+c 是退出tail命令其他情况: tail -n ...
datatable表格框架服务器端分页查询设置
更多内容推荐微信公众号,欢迎关注: js代码如下: $('#mytable').dataTable( { "bServerSide": true, //开启服务器模式,使用服务器端 ...
perl6: hash小笔记
> ,,, { => , => } > my $a = :%h h => { => , => } > $a.perl :h({, }) > my ...
linux===sar命令性能监控
sar介绍: sar是System Activity Reporter(系统活动情况报告)的缩写.sar工具将对系统当前的状态进行取样,然后通过计算数据和比例来表达系统的当前运行状态.它的特点是可以连 ...
nginx_upstream_check_module-master对nginx的后端机器进行健康状态检查报403错误【转】
在nginx.conf配置文件中在server添加 location /nstatus { check_status; access_log off; #allow 192.168.2.11; #d ...

【小思考】Python的float转换精度损失所想到的

【小思考】Python的float转换精度损失所想到的的更多相关文章

随机推荐

热门专题