float与double在计算机的存储方式

float和double的区别
double是双精度浮点数，内存占8个字节，有效数字16位，表示范围是-1.79E+ 308~-1.79E+308。
float是单精度浮点数，内存占4个字节，有效数字8位，表示范围是 -3.40E+38~3.40E+38。
两者处理速度不同，CPU处理float的速度比处理double快。double的精度高，double消耗内存是float的两倍。
如果不声明，小数默认是double类型，用float时需要进行强转，或者在小数后加上f。

1 范围
float和double的范围是由指数的位数来决定的。

float的指数位有8位，而double的指数位有11位，分布如下：

float：

1bit（符号位） 8bits（指数位） 23bits（尾数位）

格式
SEEE EEEE EMMM MMMM MMMM MMMM MMMM MMMM
double：

1bit（符号位） 11bits（指数位） 52bits（尾数位）

在数学中，特别是在计算机相关的数字（浮点数）问题的表述中，有一个基本表达法：
value of floating-point = significand xbase ^ exponent , with sign
译为中文表达即为：
（浮点）数值 = 尾数 × 底数 ^ 指数，（附加正负号）

S：符号位
E：指数，十进制指数加上127后的值得二进制数据
M：底数

符号位

指底数的符号，可正可负。

指数

占用8bit的二进制数，可表示数值范围为0-255。

但是指数可正可负，所以，IEEE规定，此处算出的次方必须减去127才是真正的指数。

所以，float类型的指数可从-127到128，而double的指数范围为-1023 ~ 1024，并且指数位是按补码的形式来划分的。其中负指数决定了浮点数所能表达的绝对值最小的数；而正指数决定了浮点数所能表达的绝对值最大的数，也即决定了浮点数的取值范围。

底数

实际是占用24bit的一个值，但是最高位始终为1，所以，最高位省去不存储，在存储中占23bit
科学计数法。

2 精度
float和double的精度是由尾数的位数来决定的。浮点数在内存中是按科学计数法来存储的，其整数部分始终是一个隐含着的“1”，由于它是不变的，故不能对精度造成影响。

float：2^23 = 8388608，一共七位，这意味着最多能有7位有效数字，但绝对能保证的为6位，也即float的精度为6~7位有效数字；

double：2^52 = 4503599627370496，一共16位，同理，double的精度为15~16位。

float存储示例

17.625在内存中的存储

首先要把17.625换算成二进制：10001.101

在将10001.101右移，直到小数点前只剩1位：
1.0001101 * 2^4 因为右移动了四位

底数：因为小数点前必为1，所以IEEE规定只记录小数点后的就好。所以，此处的底数为：0001101
指数：实际为4，必须加上127(转出的时候，减去127)，所以为131。也就是10000011
符号：整数，所以是0

综上所述，17.625在内存中的存储格式是：
01000001 10001101 00000000 00000000

posted @ 2022-07-31 16:40 风子磊阅读(805) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 两个数交换的四种方法

· 基本数据类型转换规则

· float与double

· float和double有什么区别

· [转载]c++ double和float类型是怎么存储和表示的

阅读排行：
· 终于写完轮子一部分：tcp代理了，记录一下
· 震惊！C++程序真的从main开始吗？99%的程序员都答错了
· 别再用vector＜bool＞了！Google高级工程师：这可能是STL最大的设计失误
· 单元测试从入门到精通
· 【硬核科普】Trae如何「偷看」你的代码？零基础破解AI编程运行原理

历史上的今天：
2020-07-31 Java枚举类Enum

公告

昵称：风子磊
园龄： 7年10个月
粉丝： 5
关注： 9

+加关注

2025年3月

日

一

二

三

四

五

六

风子磊

花开堪折直须折，莫待无花空折枝

float与double在计算机的存储方式

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论