一文读懂Base64编码

Base64编码

字符对应表

上表就是用来表示Base64,一共64个字符，A-Z,a-z,0-9,+,/(上表打错了),还有=(作为补位)
无论将文件，字符串，还是什么转为Base64，一定是用上表的字符表示。

转换方式是将三个字节分为一个单元，因为一个字节占8位，所以一个单元就是24位，然后将一个单元又分为四个部分，每一部分是6位，在每个部分前面补00,于是一个单元就变成了32位,也就是4个字节,然后算出每一部分的十进制,再对应Base64字符对应表上面的符号,一单元的四个部分加起来就是Base64,说得比较抽象,我们用图来说话

如上图我们对字符串"LIU"进行Base64编码,因为刚好为3个字节，所以为一个单元，LIU对应的ASCII码为76，73，85，对应的二进制分别为 01001100，01001001，01010101，然后将其分为四部分并补0后为，00010011，00000100，00100101，00010101，它们所对应的Base64 索引和字符为，19(T) , 4(E) , 37(l) , 21(V) , 所以"LIU"编译后的Base64编码为"TElV"

如果是两个字节

两个字节的情况分为三组，第三组只有四位（1001），这时候要再首尾都加2个0，为（00100100），计算出来是 TEk ,因为只有两个字节，所以第三个用=代替，加上=，为 TEk=

如果一个字节

一个字节则分为两组，第二组为00，前面补00，后面补0000，为（00000000），在Base64上面对应A,所以为"TA",因为为一个字节，所以后两个用==代替，为 TA==

汉字转为Base64编码

对于汉字转Base64编码,首先要确定编码方式,又utf-8,utf-16,utf-32,gbk等等,每种编码的汉字对应的Base64是不相同的，比如"刘"的编码方式为utf-8 ,那么用Base64编码后为5YiY,如果编码方式为utf-16,那么经过Base64编码后为/v9SGA==，所以不同的编码方式对应不同的Base64编码，如果用utf-8编码的文字转为Base64编码，用utf-16对Base64进行解码，那么解码得到的将为乱码。

JAVA API

编码

Base64.getEncoder().encode(byte[] bytes);  
Base64.getEncoder().encodeToString(byte[] bytes);  
and so on

解码

Base64.getDecoder().decode(byte[] bytes);  
and so on

示例

/**
 * TODO
 *
 * @author 刘牌
 * @version 1.0
 * @date 2021/9/7 0007 21:25
 */
public class Base64Test {
    public static void main(String[] args) {
        String str = "LIU";
        String s = Base64.getEncoder().encodeToString(str.getBytes(Charset.forName("utf-16")));
        System.out.println(s);
        byte[] bytes = Base64.getDecoder().decode(s.getBytes());
        String s1 = new String(bytes, Charset.forName("utf-16"));
        System.out.println(s1);
    }
}

posted @ 2021-09-07 23:58 苏格拉的底牌阅读(2268) 评论(0) 收藏举报

刷新页面返回顶部

苏格拉的底牌

奉行终身学习，一路坎坷仍不忘初心，相信未来是留给有准备的人！