Base64编码

Base64编码

Base64是一种基于64个可打印字符来表示二进制数据的表示方法。由于2的6次方等于64,所以每6个比特为一个单元,对应某个可打印字符。3个字节有24个比特,对应于4个Base64单元,即3个字节可由4个可打印字符来表示。它可用来作为电子邮件的传输编码。在Base64中的可打印字符包括字母A-Z、a-z、数字0-9,这样共有62个字符,此外两个可打印符号在不同的系统中而不同

Base64算法,ASCII码字符串 -- Base64编码("0-9",“A-Z”,"a-z", '+')

https://img-blog.csdnimg.cn/20190304150859716.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzE5NzgyMDE5,size_16,color_FFFFFF,t_70

需要把3个字节转换为4部分

xxxx xxxx | xxxx xxxx | xxxx xxxx

https://img-blog.csdnimg.cn/20190304154055574.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzE5NzgyMDE5,size_16,color_FFFFFF,t_70

24位字符串:“010011010110000101101110”的第一组6位数是“010011”,对应的十进制数是19,我们查找索引表发现,19对应的字符是“T”,因此,第一组6位数对应的字符就是“T”;同理,第二组6位数是“010110”,对应的十进制数是22,查找索引表,22对应的字符是“W”;同理,第三组6位数是“000101”,对应的十进制是5,查表得,5对应的字符是“F”;同理,第四组6位数是“101110”,对应的十进制是46,查表得,46对应的字符是“F”。到此,3个ASCII字符,一共24位,最后编码成了4个ASCII字符,32位。因此,从24位到32位的转变,使得Base64编码的结果要比原来的值变得更大,且大1/3。因此,Base64编码实质上就是把一个个24比特位组成的二进制组合转换成32比特位组成的二进制组合。

Base64常用于在通常处理文本[数据]的场合,表示、传输、存储一些二进制数据,包括MIME电子邮件XML的一些复杂数据。

https://img-blog.csdnimg.cn/20190304161336383.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzE5NzgyMDE5,size_16,color_FFFFFF,t_70

编码部分

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

// Base64字符映射表
static const char base64_chars[] = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";

// Base64编码函数
char *base64_encode(const unsigned char *input, int length) {
    // 计算编码后的长度,4 * ((length + 2) / 3) 确保每三个字节编码成四个字符
    int enc_len = 4 * ((length + 2) / 3);
    char *encoded = (char *)malloc(enc_len + 1); // 为编码后的字符串分配内存
    if (!encoded) {
        return NULL; // 如果内存分配失败,返回NULL
    }

    int i = 0, j = 0;
    unsigned char char_array_3[3], char_array_4[4];

    // 循环遍历输入数据
    while (length--) {
        char_array_3[i++] = *(input++); // 将输入数据分成3字节一组
        if (i == 3) {
            // 将3字节数据编码成4个Base64字符
            char_array_4[0] = (char_array_3[0] & 0xfc) >> 2;
            char_array_4[1] = ((char_array_3[0] & 0x03) << 4) + ((char_array_3[1] & 0xf0) >> 4);
            char_array_4[2] = ((char_array_3[1] & 0x0f) << 2) + ((char_array_3[2] & 0xc0) >> 6);
            char_array_4[3] = char_array_3[2] & 0x3f;

            for (i = 0; i < 4; i++) {
                encoded[j++] = base64_chars[char_array_4[i]]; // 映射Base64字符
            }
            i = 0;
        }
    }

    // 处理剩余的字节
    if (i) {
        for (int k = i; k < 3; k++) {
            char_array_3[k] = '\0';
        }

        char_array_4[0] = (char_array_3[0] & 0xfc) >> 2;
        char_array_4[1] = ((char_array_3[0] & 0x03) << 4) + ((char_array_3[1] & 0xf0) >> 4);
        char_array_4[2] = ((char_array_3[1] & 0x0f) << 2) + ((char_array_3[2] & 0xc0) >> 6);
        char_array_4[3] = char_array_3[2] & 0x3f;

        for (int k = 0; k < i + 1; k++) {
            encoded[j++] = base64_chars[char_array_4[k]];
        }

        while (i++ < 3) {
            encoded[j++] = '=';
        }
    }

    encoded[j] = '\0'; // 添加字符串结束符
    return encoded;
}

解码部分

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

// Base64字符映射表
static const char base64_chars[] = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";

// 获取Base64字符对应的值
static int base64_char_value(char c) {
    if (c >= 'A' && c <= 'Z') return c - 'A';
    if (c >= 'a' && c <= 'z') return c - 'a' + 26;
    if (c >= '0' && c <= '9') return c - '0' + 52;
    if (c == '+') return 62;
    if (c == '/') return 63;
    return -1;
}

// Base64解码函数
unsigned char *base64_decode(const char *input, int *output_length) {
    int length = strlen(input);
    int i = 0, j = 0, in = 0;
    int dec_len = length / 4 * 3; // 计算解码后的长度
    unsigned char *decoded = (unsigned char *)malloc(dec_len); // 为解码后的数据分配内存
    if (!decoded) {
        return NULL; // 如果内存分配失败,返回NULL
    }

    unsigned char char_array_4[4], char_array_3[3];

    // 循环遍历输入数据
    while (length-- && (input[in] != '=') && (base64_char_value(input[in]) != -1)) {
        char_array_4[i++] = input[in++];
        if (i == 4) {
            for (i = 0; i < 4; i++) {
                char_array_4[i] = base64_char_value(char_array_4[i]);
            }

            char_array_3[0] = (char_array_4[0] << 2) + ((char_array_4[1] & 0x30) >> 4);
            char_array_3[1] = ((char_array_4[1] & 0xf) << 4) + ((char_array_4[2] & 0x3c) >> 2);
            char_array_3[2] = ((char_array_4[2] & 0x3) << 6) + char_array_4[3];

            for (i = 0; (i < 3); i++) {
                decoded[j++] = char_array_3[i]; // 将4个Base64字符解码成3字节数据
            }
            i = 0;
        }
    }

    // 处理剩余的字符
    if (i) {
        for (int k = i; k < 4; k++) {
            char_array_4[k] = 0;
        }

        for (int k = 0; k < 4; k++) {
            char_array_4[k] = base64_char_value(char_array_4[k]);
        }

        char_array_3[0] = (char_array_4[0] << 2) + ((char_array_4[1] & 0x30) >> 4);
        char_array_3[1] = ((char_array_4[1] & 0xf) << 4) + ((char_array_4[2] & 0x3c) >> 2);
        char_array_3[2] = ((char_array_4[2] & 0x3) << 6) + char_array_4[3];

        for (int k = 0; (k < i - 1); k++) {
            decoded[j++] = char_array_3[k];
        }
    }

    *output_length = j; // 设置解码后的长度
    return decoded;
}

仅用于学习记录

参考:

什么是Base64算法?——全网最详细讲解-CSDN博客

posted @ 2024-06-13 16:38  晖_IL  阅读(8)  评论(0编辑  收藏  举报