Java中float/double取值范围与精度

Java浮点数

浮点数结构

　　要说清楚Java浮点数的取值范围与其精度，必须先了解浮点数的表示方法，浮点数的结构组成，之所以会有这种所谓的结构，是因为机器只认识01，你想表示小数，你要机器认识小数点这个东西，必须采用某种方法，比如，简单点的，float四个字节，前两个字节表示整数位，后两个字节表示小数位（这就是一种规则标准），这样就组成一个浮点数。而Java中浮点数采用的是IEEE 754标准。

IEEE 754

　　这里就不细说什么是IEEE 754了，就直接讲具体内容，有兴趣的可以自己百度。

float

符号位（S）：1bit

指数位（E）：8bit

尾数位（M）：23bit

一个float4字节32位，分为三部分：符号位，指数位，尾数位。
(1).符号位(S)：最高位（31位）为符号位，表示整个浮点数的正负，0为正，1为负；
(2).指数位(E)：23-30位共8位为指数位，这里指数的底数规定为2（取值范围：0~255）。这一部分的最终结果格式为：

2^{E - 127}

符号	指数部分	指数部分-127	尾数部分	小数部分的最高有效位	形式
1	255	128	非0	没有	NaN
1	255	128	0	没有	负无穷
1	1~254	-126~127	任意	1	正规形式（负数）
1	0	-127	非0	0	非正规形式（负数）
1	0	-127	0	没有	负0
0	0	-127	0	没有	正0
0	0	-127	非0	0	非正规形式（正数）
0	1~254	-126~127	任意	1	正规形式（正数）
0	255	128	0	没有	正无穷
0	255	128	非0	没有	NaN

double

符号位（S）：1bit

指数位（E）：11bit

尾数位（M）：52bit

　　double这里就类似float，只是double的长度更大，所以范围就更大，但规则是一样的。double的值 = $(- 1)^{S} * (2^{E - 1023}) * (1. M)$

取值范围

根据表1可知，float的取值范围：
负无穷 —— $- 2^{128}$

Float.POSITIVE_INFINITY或Double.POSITIVE_INFINITY//表示正无穷大
Float.NEGATIVE_INFINITY或Double.NEGATIVE_INFINITY//负无穷大
//他们打印的结果：+/-Infinity
float f1 = (float)Math.pow(2,128);//指数>=128的，打印结果：Infinity
//上面要加(float)强制转换，否则编译提示出错，详细可参考前一节：Java变量数据类型
float f2 = (float)Math.pow(2,127);//1.7014118E38
System.out.println(Float.MAX_VALUE);//3.4028235E38
//其他测试，读者可自行测试

2). -149的得来：看上面理论应该是150（指数全0，则指数值 = 0 -127，这个时候尾数取最小， $2^{- 23}$

float f3 = (float) Math.pow(2,-149)//1.4E-45，小于-149，结果则为0.0
Float.MIN_VALUE //1.4E-45

double的取值同float：
负无穷 —— $- 2^{1024}$

　　另外，注意表格中，还有NaN，即表示非数值，例如：

System.out.println(0.0/0.0);//打印结果：NaN。注意不能是 0/0
//NaN表示计算错误，具体出现情况，可以参考表中
//Float.NaN或 Double.NaN 也能直接表示NaN，NaN与其他数计算结果均为NaN，除了
Math.pow(Float.NaN,0);//结果为1.0
//另外NaN == NaN; false

浮点数精度

　　精度是由尾数决定的，为什么？由浮点数的值计算公式可知：当指数的最终值为负，虽然这个时候浮点数的值能表示更小，但这个时候仅仅能表示0~1（或-1~0）这个数段的小数，没有实际意义。所以精度主要是看尾数的值。

float

　　float的尾数：23位，其范围为：0~ $2^{23}$

System.out.println((float)Math.pow(10,6.92));//注意加float强制转换
//打印结果8317637.5，float只保证7~8位有效位，其余位数舍入

　　不理解的话，可以再这样想：23位，二进制0101……0101，尾数表示小数位，最小为0000……0001（22个0，最后一个1），即 $2^{- 23}$

double

　　计算方式同float，double的尾数：52位， $2^{- 52}$

posted @ 2018-07-03 16:20 割肉机阅读(5377) 评论(0) 收藏举报

刷新页面返回顶部

割肉机

Java中float/double取值范围与精度

Java浮点数

浮点数结构

IEEE 754

float

double

取值范围

浮点数精度

float

double

公告