【0.1 + 0.2 = 0.30000000000000004】该怎样理解？

如果你以前没了解过类似的坑，乍一看似乎觉得不可思议。但是某些语言下事实确实如此（比如 Javascript）：

再看个例子，+1 后居然等于原数，没天理啊！

如果你不知道原因，跟着楼主一起来探究下精度丢失的过程吧。

事实上不仅仅是 Javascript，在很多语言中 0.1 + 0.2 都会得到 0.30000000000000004，为此还诞生了一个好玩的网站 0.30000000000000004。究其根本，这些语言中的数字都是以 IEEE 754 双精度 64 位浮点数来存储的，它的表示格式为：

(s) * (m) * (2^e)

s 是符号位，表示正负。m 是尾数，有 52 bits。e 是指数，有 11 bits，e 的范围是 [-1074, 971]（ECMAScript 5 规范），这样其实很容易推出 Javascript 能表示的最大数为：

1 * (Math.pow(2, 53) - 1) * Math.pow(2, 971) = 1.7976931348623157e+308

而这个数也就是 Number.MAX_VALUE 的值。

同理可推得 Number.MIN_VALUE 的值：

1 * 1 * Math.pow(2, -1074) = 5e-324

需要注意的是，Number.MIN_VALUE 表示的是最小的比零大的数，而不是最小的数，最小的数很显然是 -Number.MAX_VALUE。

可能你已经注意到，当计算 Number.MAX_VALUE 时，(Math.pow(2, 53) - 1) 的结果用二进制表示是 53 个 1，除了 m 表示的 52 个 bits 外，其实最前面的 1 bit 是隐藏位（隐藏位表示的永远是 1），设置隐藏位为的是能表示更大范围的数。(对于隐藏位我也不是很清楚，一说 "当指数 e 的二进制位全为 0 时，隐藏位为 0，如果不全为 0，则隐藏位为 1，这应该是基于指数表达式的存储方式决定的，隐藏位也就是指数的底数里面的整数部分，尾数 m 则是指数中底数的 fraction 小数部分" 详见 Javascript 中小数和大整数的精度丢失问题）

复习了一些组成原理的知识后，我们再回到 0.1 + 0.2 这道题本身。我们都知道，计算机中的数字都是以二进制存储的，如果要计算 0.1 + 0.2 的结果，计算机会先把 0.1 和 0.2 分别转化成二进制，然后相加，最后再把相加得到的结果转为十进制。

我们先把 0.1 和 0.2 分别转化为二进制，十进制转为二进制这里就不多说了，整数部分 "除二取余，倒序排列"，小数部分 "乘二取整，顺序排列"。也可以用 Javascript 的 toString(2) 方法验证转换的结果。

// 0.1 转化为二进制
0.0 0011 0011 0011 0011...(0011循环）

// 0.2 转化为二进制
0.0011 0011 0011 0011 0011...(0011循环）

当然计算机并不能表示无限小数，毕竟只有有限的资源，于是我们得把它们用 IEEE 754 双精度 64 位浮点数来表示：

e = -4; m = 1.1001100110011001100110011001100110011001100110011010 (52位)
e = -3; m = 1.1001100110011001100110011001100110011001100110011010 (52位)

当然，真实的计算机存储中 m 并不会是一个小数，而是上面的小数点后的 52 bits，小数点前的 1 为隐藏位。

这里又出现一个问题，虽然我们已经明确 m 只能有 52 位（小数点后)，但是如果第 53 位是 1，是该进位还是不进位？这里需要考虑 IEEE 754 Rounding modes，可以看下这篇文章浮点数解惑，或者听我简单地解释下。

关于默认的舍入规则，简单的说，如果 1.101 要保留一位小数，可能的值是 1.1 和 1.2，那么先看 1.101 和 1.1 或者 1.2 哪个值更接近，毫无疑问是 1.1，于是答案是 1.1。那么如果要保留两位小数呢？很显然要么是 1.10 要么是 1.11，而且又一样近，这时就要看这两个数哪个是偶数（末位是偶数），保留偶数为答案。综上，如果第 52 bit 和 53 bit 都是 1，那么是要进位的。

另外，相加时如果指数不一致，需要对齐，一般情况下是向右移，因为最右边的即使溢出了，损失的精度远远小于左边溢出。

接下去就不难了：

  e = -4; m = 1.1001100110011001100110011001100110011001100110011010 (52位)
+ e = -3; m = 1.1001100110011001100110011001100110011001100110011010 (52位)
---------------------------------------------------------------------------
  e = -3; m = 0.1100110011001100110011001100110011001100110011001101 
+ e = -3; m = 1.1001100110011001100110011001100110011001100110011010
---------------------------------------------------------------------------
  e = -3; m = 10.0110011001100110011001100110011001100110011001100111
---------------------------------------------------------------------------
  e = -2; m = 1.0011001100110011001100110011001100110011001100110100(52位)
---------------------------------------------------------------------------
= 0.010011001100110011001100110011001100110011001100110100
= 0.30000000000000004(十进制)

而 9007199254740992 + 1 = 9007199254740992 的推理过程大同小异。

9007199254740992 其实就是 2 ^ 53。

  e = 0; m = 100000000000000000000000000000000000000000000000000000 (53个0)
+ e = 0; m = 1 
---------------------------------------------------------------------------
  e = 0; m = 100000000000000000000000000000000000000000000000000001

因为 m 只能有 52 位，而上面相加两数相加后 m 有 53 位（已经除去首位隐藏位），又因为 Rounding modes 的偶数原则，所以将 53 bit 的 1 舍去，所以大小跟 2 ^ 52 并没有变化，试想下，如果是 + 2，那么结果就不一样了。（ps：其实 2^53 在计算机存储中的 m 只能有 52 位，即只有 52 个 0）

事实上，当结果大于 Math.pow(2, 53) 时，会出现精度丢失，导致最终结果存在偏差，而当结果大于 Number.MAX_VALUE，直接返回 Infinity。

如果你觉得已经足够了解 IEEE 754 双精度 64 位浮点数的运算性质了，不妨试试玉伯在 JavaScript 中小数和大整数的精度丢失一文最后留下的思考题：

Number.MAX_VALUE + 1 == Number.MAX_VALUE;
Number.MAX_VALUE + 2 == Number.MAX_VALUE;
...
Number.MAX_VALUE + x == Number.MAX_VALUE;
Number.MAX_VALUE + x + 1 == Infinity;
...
Number.MAX_VALUE + Number.MAX_VALUE == Infinity;

// 问题：
// 1. x 的值是什么？
// 2. Infinity - Number.MAX_VALUE == x + 1; 是 true 还是 false ?

2016-07-21 补：

之前类似如此的精度缺失问题，我都会推荐先将其乘以 10 的倍数，化为整数的方式：

(0.1 * 10 + 0.2 * 10) / 10 
=> 0.3

直到看到此文你不一定知道的几个前端小知识：

2177.74*100
=> 217773.99999999997

楼主不禁又陷入了思考...

posted on 2015-12-10 06:37 lessfish 阅读(5966) 评论(15) 编辑收藏举报

刷新页面返回顶部

simplify the life

【0.1 + 0.2 = 0.30000000000000004】该怎样理解？

导航

公告