【C语言】浮点数的秘密

IEEE 754 标准

存储方式:符号位,指数,尾数
IEEE 浮点数算术标准:IEEE 754

类型 符号位 指数 尾数
float 1 8 23
double 1 11 52

以 float 为例,讨论浮点数。

浮点类型与整数类型的内存表示方法不同,浮点类型的内存表示法相对复杂。

根据 IEEE 754 标准,float 将自身 32bits 分成三个部分,符号位 S 占 1bit,指数 E 占 8bits,尾数 M 占 23bits。

下面用一个共用体讨论 float 类型的内存表示。

union
{
    float f; //真值
    struct
    {
        uint32_t M : 23; // 指数
        uint32_t E : 8;  // 尾数
        uint32_t S : 1;  //符号位
    };
    uint32_t v; //机器码
} f;

浮点数计算公式:
$$f = (-1){S}21.M$$

举个例子:已知机器码 f.v = 0x41360000,求真值 f.f。

  1. 机器码展开成二进制 0x41360000 -> 0b0100 0001 0011 0110 0000 0000 0000 0000;切分得到 S = 0b0 = 0x0 = 0,E = 0b100 0001 0 = 0x82 = 130,M = 0b011 0110 0000 0000 0000 0000 = 0x360000;
  2. 1.M 为二进制小数计算,根据 S 和 E 得正号乘 2 的立方乘 1.M,即小数点右移动三位,真值 f.f = 0b1011.011 = 11.375。

代码验证:

#include <stdio.h>
#include <stdint.h>

union uFloat
{
    float f; //真值
    struct
    {
        uint32_t M : 23; // 指数
        uint32_t E : 8;  // 尾数
        uint32_t S : 1;  //符号位
    };
    uint32_t v; //机器码
} f;

void uPrintln(union uFloat uf)
{
    printf("f: %f\nS: 0x%x, E: 0x%x, M: 0x%x\nv: 0x%08x\n", uf.f, uf.S, uf.E, uf.M, uf.v);
}

int main(void) {
    f.v = 0x41360000;
    uPrintln(f);
    printf("sizeof: %d\n", sizeof(f));
    return 0;
}

输出:

f: 11.375000
S: 0x0, E: 0x82, M: 0x360000
v: 0x41360000
sizeof: 4

不精确的类型

在有限的位数里,浮点类型比 uint32_t 表达了更大的范围,导致部分数据丢失,不能表示所有准确的数值,是一种不精确的类型。

比如开区间 (338291141358099960719503586036763590656.0,339620349071475272940736969149792649216.0)中,至少有 4202553 个整数皆不能正常表示。

int main(void) {
    f.f = 338291141358099960719503586036763599657.000000;
    uPrintln(f);
    return 0;
}

输出:

f: 338291141358099960719503586036763590656.000000
S: 0x0, E: 0xfe, M: 0x7e8081
v: 0x7f7e8081

浮点型数据越接近零值,误差越小,反之越大。

验证

通过两个简单的程序验证这个结论。

这个 C 程序的作用是增加机器码间隔采样对应的浮点数,并打印到表格文件中。

#include <stdio.h>
#include <stdint.h>

union
{
    float f;
    struct
    {
        uint32_t M : 23; // 指数
        uint32_t E : 8;  // 尾数
        uint32_t S : 1;  //符号位
    };
    int32_t i;
} u;

void uPrintln(float f)
{
    u.f = f;
    printf("i: %d, f: %f, S: %d, E: %d, M: %d\n", u.i, u.f, u.S, u.E, u.M);
}

void ufPrintln(float f, FILE *fp)
{
    u.f = f;
    fprintf(fp, "%d,0x%08x,%f,%d,%d,%d,\n", u.i, u.i, u.f, u.S, u.E, u.M);
}

void pPrintfln(uint32_t cur, uint32_t max)
{
    static uint64_t tmp = 0;
    uint64_t pten = cur * 100 / max;
    if (tmp != pten)
    {
        tmp = pten;
        printf("\rprocessing: %d", pten);
    }
}

#define MAX UINT32_MAX
#define INT UINT16_MAX

int main(void)
{
    FILE *fp = NULL;

    fp = fopen("float.csv", "w+");
    if (fp == NULL)
    {
        printf("open error!\n");
        return -1;
    }
    printf("open successful!\n");
    fprintf(fp, "i,i,f,S,E,M,\n");
    for (uint32_t i = 0; i < MAX; i += INT)
    {
        u.i = i;
        ufPrintln(u.f, fp);
        pPrintfln(i, MAX);
    }
    fclose(fp);

    return 0;
}

这个 python 文件的作用是读取表格文件,描点作图。

import matplotlib.pyplot as plt
import pandas as pds

data = pds.read_csv('./float.csv')
data.plot(x="i.1", y="f")
plt.show()

可见,当机器码增加到一定程度时,浮点数值开始指数级变化,这就表示在两个相邻的机器码之间,跨越、丢失的浮点数越多。
OtzVC6.md.png

交流

微信公众号:物联指北
B站:物联指北
千人企鹅群:658685162

posted @   dissor  阅读(186)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具
点击右上角即可分享
微信分享提示