java中的float和double的精度问题

此文解释了为何float的范围比int大(同样4字节),但有些int是float无法正确表达的(精度丢失)


java中的float和double的精度问题

 

1、背景知识 
在java中没有细讲,只是讲了float占32位(bit),double占 64位。 
对于计算机来说,用位数表示是合适的。但有人喜欢用字节(byte)表示。一个字节占8位。 
1 byte = 8 bit. 
所以float占4个字节,double占8个字节。 
不过我还是喜欢用位数表示。这样更直接,也更容易理解计算机是怎么存储这些类型的。 

对于精度和范围,还是参考一下c++吧。 


2、存储知识 
计算器存储浮点数的方法:(用科学计数法存储) 
将要存的数先转换为小数(0.xxxxxx)x10的n次幂的形式进行存储。 
例如: 
3.1415 将被转换为:0.31415 x 10^1 
100000 将被转换为:0.1 x 10^6 

首先申明一点,先范围(有效数字位,包括整数位和小数位),再精度。 


3、下面切入正题 
===================== 
在c++中单精度float类型与双精度double类型的问题 

【"单精度用float表示,在计算机中使用4位字节(32位bit)来表示,具有7位有效数字"】 

float类型存储的时候1个bit是符号位,8个bit是指数位,剩下的23个bit是有效数字位。 
2的23次方是8388608,即7位有效数字,精度(10进制)。 

一个单精度的浮点数在内存当中占用了32个bit位,按照浮点数的表示标准,最高位表示符号,这32位一部分用来表示阶码,一部分用来表示小数部分。 
按照这个表示方法转化成10进制之后,它能表示的最高精度是7位有效数字。 

比如 
float a=3.14159;a在内存中实际上表示为0.314159乘以10的1次方(0是符号位),而分配给a的存储单元就分为两部分,一部分存0.314159,一部分存指数1,而且也都是转化为2进制来存。 

================== 
float ,1位符号位, 8位指数位,23位尾数位 
double,1位符号位,11位指数位,52位尾数位 

float尾数位23位,2^23=8.3E6,7位,所以不同的编译器规定不同,有些是7位,有些8位 
double尾数52位,2^52=4.5E15,15位,所以double的有效位数是15位 


后记: 
数一下有效数字位数(整数位+小数位),7位以内的用float,15位以内的用double 
但是还有一点小小的区别: 
float f =  (float) 62345678.912345;  // => 6.234568E7  共 7 位 
float f2 =  (float) 12345678.912345; // => 1.2345679E7 共 8 位 

(精度问题,float精度为7--8位,8位的情况是第一位是1,当是2时进位后面的精度丢失?)

posted @ 2018-01-11 10:01  风沙星辰  阅读(8930)  评论(4编辑  收藏  举报