Base64编码与解码
简介
Base64是网络上最常见的用于传输8Bit字节代码的编码方式之一,大家可以查看RFC2045~RFC2049,上面有MIME的详细规范。Base64编码可用于在HTTP环境下传递较长的标识信息。
原理
Base64加密方式是将三个八位的字节转化为四个六位的字节(不足八位的高位补00),3*8 = 4*6;,所以base64加密过后的内容比原来的大三分之一;
举例:加密“ace”,
ace转化为二进制为:01100001 01100011 01100101
转化为base64的四字节六位:011000 010110 001101 100101
那因为计算机是一字节八位的存数,所以高位补00后变为:00011000 00010110 00001101 00100101
转化为十进制:24 22 13 37
查Base64对照表(默认版本RFC2045):
我们得到最终结果:YWNl
我们观察这个对照表,大小写的字母26*2 加上10个数字 加上两个特殊符号 + / 一共64个字符,因为Base64有效位只有六位,所以最大能表示的字符就为2的6次方64;
例子中为了方便演示我只取了三个字节的字符串,实际中会存在字节数量不是3倍数的情况,Base64是这样处理的:
剩余的字节根据编码规则继续单独转(不够的位数用0补全),再用=号补满4个字节。这就是为什么有些Base64编码会以一个或两个等号结束的原因,但等号最多只有两个。因为:
一个原字节至少会变成两个目标字节(原字节八位,目标字节六位),两个原字节至少会变成三个目标字节;
所以如果余数为1的话,转成2个Base64编码字符,这个时候我们需要补2个等号;如果余数为2的话,转成3个Base64编码字符,这个时候我们需要补1个等号;
实现
java
private static final byte ENCODE[] = { 'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '+', '/', }; public static String encode(String str){ byte[] bytes = str.getBytes(); String result1 = Base64.encodeToString(bytes, Base64.DEFAULT); int temp = ((bytes[0] & 0xff) << 16) | ((bytes[1] & 0xff) << 8) | ((bytes[2] & 0xff)); int char1 = (temp>>18 & 0x3f); int char2 = (temp>>12 & 0x3f); int char3 = (temp>>6 & 0x3f); int char4 = (temp & 0x3f); String result2 = new String(new byte[]{ENCODE[char1],ENCODE[char2],ENCODE[char3],ENCODE[char4]}); LogUtil.i(result1 +""+result2); return result2; }
C
#include <stdio.h> #include <string.h> // 全局常量定义 const char * base64char = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"; const char padding_char = '='; /*编码代码 * const unsigned char * sourcedata, 源数组 * char * base64 ,码字保存 */ int base64_encode(const unsigned char * sourcedata, char * base64) { int i=0, j=0; unsigned char trans_index=0; // 索引是8位,但是高两位都为0 const int datalength = strlen((const char*)sourcedata); for (; i < datalength; i += 3){ // 每三个一组,进行编码 // 要编码的数字的第一个 trans_index = ((sourcedata[i] >> 2) & 0x3f); base64[j++] = base64char[(int)trans_index]; // 第二个 trans_index = ((sourcedata[i] << 4) & 0x30); if (i + 1 < datalength){ trans_index |= ((sourcedata[i + 1] >> 4) & 0x0f); base64[j++] = base64char[(int)trans_index]; }else{ base64[j++] = base64char[(int)trans_index]; base64[j++] = padding_char; base64[j++] = padding_char; break; // 超出总长度,可以直接break } // 第三个 trans_index = ((sourcedata[i + 1] << 2) & 0x3c); if (i + 2 < datalength){ // 有的话需要编码2个 trans_index |= ((sourcedata[i + 2] >> 6) & 0x03); base64[j++] = base64char[(int)trans_index]; trans_index = sourcedata[i + 2] & 0x3f; base64[j++] = base64char[(int)trans_index]; } else{ base64[j++] = base64char[(int)trans_index]; base64[j++] = padding_char; break; } } base64[j] = '\0'; return 0; }