Base64编码与解码

简介

Base64是网络上最常见的用于传输8Bit字节代码的编码方式之一,大家可以查看RFC2045~RFC2049,上面有MIME的详细规范。Base64编码可用于在HTTP环境下传递较长的标识信息。

原理

Base64加密方式是将三个八位的字节转化为四个六位的字节(不足八位的高位补00),3*8 = 4*6;,所以base64加密过后的内容比原来的大三分之一;
举例:加密“ace”,
ace转化为二进制为:‭01100001‬ ‭01100011‬ ‭01100101‬
转化为base64的四字节六位:011000 01‬‭0110 0011‬01 100101‬
那因为计算机是一字节八位的存数,所以高位补00后变为:00011000 0001‬‭0110 000011‬01 00100101‬
转化为十进制:24 22 13 37
查Base64对照表(默认版本RFC2045):

 

 

 我们得到最终结果:YWNl

我们观察这个对照表,大小写的字母26*2 加上10个数字 加上两个特殊符号 + / 一共64个字符,因为Base64有效位只有六位,所以最大能表示的字符就为2的6次方64;
例子中为了方便演示我只取了三个字节的字符串,实际中会存在字节数量不是3倍数的情况,Base64是这样处理的:
剩余的字节根据编码规则继续单独转(不够的位数用0补全),再用=号补满4个字节。这就是为什么有些Base64编码会以一个或两个等号结束的原因,但等号最多只有两个。因为:
一个原字节至少会变成两个目标字节(原字节八位,目标字节六位),两个原字节至少会变成三个目标字节;
所以如果余数为1的话,转成2个Base64编码字符,这个时候我们需要补2个等号;如果余数为2的话,转成3个Base64编码字符,这个时候我们需要补1个等号;

实现

java

private static final byte ENCODE[] = {
            'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P',
            'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z', 'a', 'b', 'c', 'd', 'e', 'f',
            'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v',
            'w', 'x', 'y', 'z', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '+', '/',
    };
 
    public static String encode(String str){
        byte[] bytes = str.getBytes();
        String result1 = Base64.encodeToString(bytes, Base64.DEFAULT);
        int temp = ((bytes[0] & 0xff) << 16) | ((bytes[1] & 0xff) << 8) | ((bytes[2] & 0xff));
        int char1 = (temp>>18 & 0x3f);
        int char2 = (temp>>12 & 0x3f);
        int char3 = (temp>>6 & 0x3f);
        int char4 = (temp & 0x3f);
        String result2 = new String(new byte[]{ENCODE[char1],ENCODE[char2],ENCODE[char3],ENCODE[char4]});
        LogUtil.i(result1 +""+result2);
        return result2;
    }

C

#include <stdio.h>
#include <string.h>
 
// 全局常量定义
const char * base64char = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";
const char padding_char = '=';
 
/*编码代码
* const unsigned char * sourcedata, 源数组
* char * base64 ,码字保存
*/
int base64_encode(const unsigned char * sourcedata, char * base64)
{
    int i=0, j=0;
    unsigned char trans_index=0;    // 索引是8位,但是高两位都为0
    const int datalength = strlen((const char*)sourcedata);
    for (; i < datalength; i += 3){
        // 每三个一组,进行编码
        // 要编码的数字的第一个
        trans_index = ((sourcedata[i] >> 2) & 0x3f);
        base64[j++] = base64char[(int)trans_index];
        // 第二个
        trans_index = ((sourcedata[i] << 4) & 0x30);
        if (i + 1 < datalength){
            trans_index |= ((sourcedata[i + 1] >> 4) & 0x0f);
            base64[j++] = base64char[(int)trans_index];
        }else{
            base64[j++] = base64char[(int)trans_index];
 
            base64[j++] = padding_char;
 
            base64[j++] = padding_char;
 
            break;   // 超出总长度,可以直接break
        }
        // 第三个
        trans_index = ((sourcedata[i + 1] << 2) & 0x3c);
        if (i + 2 < datalength){ // 有的话需要编码2个
            trans_index |= ((sourcedata[i + 2] >> 6) & 0x03);
            base64[j++] = base64char[(int)trans_index];
 
            trans_index = sourcedata[i + 2] & 0x3f;
            base64[j++] = base64char[(int)trans_index];
        }
        else{
            base64[j++] = base64char[(int)trans_index];
 
            base64[j++] = padding_char;
 
            break;
        }
    }
 
    base64[j] = '\0'; 
 
    return 0;
}

 

posted @ 2022-03-29 15:04  maao233  阅读(1162)  评论(0编辑  收藏  举报