【C语言】浮点数的秘密

IEEE 754 标准
不精确的类型
验证
交流

IEEE 754 标准

存储方式：符号位，指数，尾数
IEEE 浮点数算术标准：IEEE 754

类型	符号位	指数	尾数
float	1	8	23
double	1	11	52

以 float 为例，讨论浮点数。

浮点类型与整数类型的内存表示方法不同，浮点类型的内存表示法相对复杂。

根据 IEEE 754 标准，float 将自身 32bits 分成三个部分，符号位 S 占 1bit，指数 E 占 8bits，尾数 M 占 23bits。

下面用一个共用体讨论 float 类型的内存表示。

union
{
    float f; //真值
    struct
    {
        uint32_t M : 23; // 指数
        uint32_t E : 8;  // 尾数
        uint32_t S : 1;  //符号位
    };
    uint32_t v; //机器码
} f;

浮点数计算公式：
$$f = (-1)^{S}21.M$$

举个例子：已知机器码 f.v = 0x41360000，求真值 f.f。

机器码展开成二进制 0x41360000 -> 0b0100 0001 0011 0110 0000 0000 0000 0000；切分得到 S = 0b0 = 0x0 = 0，E = 0b100 0001 0 = 0x82 = 130，M = 0b011 0110 0000 0000 0000 0000 = 0x360000；
1.M 为二进制小数计算，根据 S 和 E 得正号乘 2 的立方乘 1.M，即小数点右移动三位，真值 f.f = 0b1011.011 = 11.375。

代码验证：

#include <stdio.h>
#include <stdint.h>

union uFloat
{
    float f; //真值
    struct
    {
        uint32_t M : 23; // 指数
        uint32_t E : 8;  // 尾数
        uint32_t S : 1;  //符号位
    };
    uint32_t v; //机器码
} f;

void uPrintln(union uFloat uf)
{
    printf("f: %f\nS: 0x%x, E: 0x%x, M: 0x%x\nv: 0x%08x\n", uf.f, uf.S, uf.E, uf.M, uf.v);
}

int main(void) {
    f.v = 0x41360000;
    uPrintln(f);
    printf("sizeof: %d\n", sizeof(f));
    return 0;
}

输出：

f: 11.375000
S: 0x0, E: 0x82, M: 0x360000
v: 0x41360000
sizeof: 4

不精确的类型

在有限的位数里，浮点类型比 uint32_t 表达了更大的范围，导致部分数据丢失，不能表示所有准确的数值，是一种不精确的类型。

比如开区间 (338291141358099960719503586036763590656.0,339620349071475272940736969149792649216.0)中，至少有 4202553 个整数皆不能正常表示。

int main(void) {
    f.f = 338291141358099960719503586036763599657.000000;
    uPrintln(f);
    return 0;
}

输出：

f: 338291141358099960719503586036763590656.000000
S: 0x0, E: 0xfe, M: 0x7e8081
v: 0x7f7e8081

浮点型数据越接近零值，误差越小，反之越大。

验证

通过两个简单的程序验证这个结论。

这个 C 程序的作用是增加机器码间隔采样对应的浮点数，并打印到表格文件中。

#include <stdio.h>
#include <stdint.h>

union
{
    float f;
    struct
    {
        uint32_t M : 23; // 指数
        uint32_t E : 8;  // 尾数
        uint32_t S : 1;  //符号位
    };
    int32_t i;
} u;

void uPrintln(float f)
{
    u.f = f;
    printf("i: %d, f: %f, S: %d, E: %d, M: %d\n", u.i, u.f, u.S, u.E, u.M);
}

void ufPrintln(float f, FILE *fp)
{
    u.f = f;
    fprintf(fp, "%d,0x%08x,%f,%d,%d,%d,\n", u.i, u.i, u.f, u.S, u.E, u.M);
}

void pPrintfln(uint32_t cur, uint32_t max)
{
    static uint64_t tmp = 0;
    uint64_t pten = cur * 100 / max;
    if (tmp != pten)
    {
        tmp = pten;
        printf("\rprocessing: %d", pten);
    }
}

#define MAX UINT32_MAX
#define INT UINT16_MAX

int main(void)
{
    FILE *fp = NULL;

    fp = fopen("float.csv", "w+");
    if (fp == NULL)
    {
        printf("open error!\n");
        return -1;
    }
    printf("open successful!\n");
    fprintf(fp, "i,i,f,S,E,M,\n");
    for (uint32_t i = 0; i < MAX; i += INT)
    {
        u.i = i;
        ufPrintln(u.f, fp);
        pPrintfln(i, MAX);
    }
    fclose(fp);

    return 0;
}

这个 python 文件的作用是读取表格文件，描点作图。

import matplotlib.pyplot as plt
import pandas as pds

data = pds.read_csv('./float.csv')
data.plot(x="i.1", y="f")
plt.show()

可见，当机器码增加到一定程度时，浮点数值开始指数级变化，这就表示在两个相邻的机器码之间，跨越、丢失的浮点数越多。

交流

微信公众号：物联指北
B站：物联指北
千人企鹅群：658685162

posted @ 2022-05-10 21:15 dissor 阅读(228) 评论(0) 收藏举报

刷新页面返回顶部

【C语言】浮点数的秘密

IEEE 754 标准

不精确的类型

验证

交流

公告