【C语言】浮点数的秘密
IEEE 754 标准
存储方式:符号位,指数,尾数
IEEE 浮点数算术标准:IEEE 754
类型 | 符号位 | 指数 | 尾数 |
---|---|---|---|
float | 1 | 8 | 23 |
double | 1 | 11 | 52 |
以 float 为例,讨论浮点数。
浮点类型与整数类型的内存表示方法不同,浮点类型的内存表示法相对复杂。
根据 IEEE 754 标准,float 将自身 32bits 分成三个部分,符号位 S 占 1bit,指数 E 占 8bits,尾数 M 占 23bits。
下面用一个共用体讨论 float 类型的内存表示。
union
{
float f; //真值
struct
{
uint32_t M : 23; // 指数
uint32_t E : 8; // 尾数
uint32_t S : 1; //符号位
};
uint32_t v; //机器码
} f;
浮点数计算公式:
$$f = (-1){S}21.M$$
举个例子:已知机器码 f.v = 0x41360000,求真值 f.f。
- 机器码展开成二进制 0x41360000 -> 0b0100 0001 0011 0110 0000 0000 0000 0000;切分得到 S = 0b0 = 0x0 = 0,E = 0b100 0001 0 = 0x82 = 130,M = 0b011 0110 0000 0000 0000 0000 = 0x360000;
- 1.M 为二进制小数计算,根据 S 和 E 得正号乘 2 的立方乘 1.M,即小数点右移动三位,真值 f.f = 0b1011.011 = 11.375。
代码验证:
#include <stdio.h>
#include <stdint.h>
union uFloat
{
float f; //真值
struct
{
uint32_t M : 23; // 指数
uint32_t E : 8; // 尾数
uint32_t S : 1; //符号位
};
uint32_t v; //机器码
} f;
void uPrintln(union uFloat uf)
{
printf("f: %f\nS: 0x%x, E: 0x%x, M: 0x%x\nv: 0x%08x\n", uf.f, uf.S, uf.E, uf.M, uf.v);
}
int main(void) {
f.v = 0x41360000;
uPrintln(f);
printf("sizeof: %d\n", sizeof(f));
return 0;
}
输出:
f: 11.375000
S: 0x0, E: 0x82, M: 0x360000
v: 0x41360000
sizeof: 4
不精确的类型
在有限的位数里,浮点类型比 uint32_t 表达了更大的范围,导致部分数据丢失,不能表示所有准确的数值,是一种不精确的类型。
比如开区间 (338291141358099960719503586036763590656.0,339620349071475272940736969149792649216.0)中,至少有 4202553 个整数皆不能正常表示。
int main(void) {
f.f = 338291141358099960719503586036763599657.000000;
uPrintln(f);
return 0;
}
输出:
f: 338291141358099960719503586036763590656.000000
S: 0x0, E: 0xfe, M: 0x7e8081
v: 0x7f7e8081
浮点型数据越接近零值,误差越小,反之越大。
验证
通过两个简单的程序验证这个结论。
这个 C 程序的作用是增加机器码间隔采样对应的浮点数,并打印到表格文件中。
#include <stdio.h>
#include <stdint.h>
union
{
float f;
struct
{
uint32_t M : 23; // 指数
uint32_t E : 8; // 尾数
uint32_t S : 1; //符号位
};
int32_t i;
} u;
void uPrintln(float f)
{
u.f = f;
printf("i: %d, f: %f, S: %d, E: %d, M: %d\n", u.i, u.f, u.S, u.E, u.M);
}
void ufPrintln(float f, FILE *fp)
{
u.f = f;
fprintf(fp, "%d,0x%08x,%f,%d,%d,%d,\n", u.i, u.i, u.f, u.S, u.E, u.M);
}
void pPrintfln(uint32_t cur, uint32_t max)
{
static uint64_t tmp = 0;
uint64_t pten = cur * 100 / max;
if (tmp != pten)
{
tmp = pten;
printf("\rprocessing: %d", pten);
}
}
#define MAX UINT32_MAX
#define INT UINT16_MAX
int main(void)
{
FILE *fp = NULL;
fp = fopen("float.csv", "w+");
if (fp == NULL)
{
printf("open error!\n");
return -1;
}
printf("open successful!\n");
fprintf(fp, "i,i,f,S,E,M,\n");
for (uint32_t i = 0; i < MAX; i += INT)
{
u.i = i;
ufPrintln(u.f, fp);
pPrintfln(i, MAX);
}
fclose(fp);
return 0;
}
这个 python 文件的作用是读取表格文件,描点作图。
import matplotlib.pyplot as plt
import pandas as pds
data = pds.read_csv('./float.csv')
data.plot(x="i.1", y="f")
plt.show()
可见,当机器码增加到一定程度时,浮点数值开始指数级变化,这就表示在两个相邻的机器码之间,跨越、丢失的浮点数越多。
交流
微信公众号:物联指北
B站:物联指北
千人企鹅群:658685162
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具