Base64的前世今生

转自: https://baijiahao.baidu.com/s?id=1644892102150918183&wfr=spider&for=pc 稍加润色

一、Base64由来

很早之前,电子邮件刚刚问世,那时候消息的传递都是英文,后来中国开通了互联网之后,对邮件的使用量也大量增加,这时候电子邮件就有了中文的需求。但是中文在传输的时候不能被有效地处理,这时候Base就出来了,Base64通过对这些中文进行编码,转化为服务器和网关能够识别的数据。这时候就能够使用电子邮件有效地传输了。

上面的这个例子不是说Base64专门为电子邮件而生的,从其诞生之初,就开始在各大领域有了广泛的应用。比如说网络上传递图片,我们可以Base64先对图片进行处理,然后就可以有效的传输了。

以上描述还是不够透彻,主要是底层传输的字符分为可见字符和不可见字符,英文及数字符号等都在ascII码的范围内,属于可见字符,除了这些可见字符,计算机底层会将有些特殊的字符或是二进制的数据转化成不可见的字符,这些不可见字符或是控制字符在传输的过程中被网关或是路由器或是交换机等不同的硬件设备错误的解读,导致传输错误的产生。

0~31以及127(共33个)是控制字符,例如:LF(换行),CR(回车).

OK,我们大致知道其用途,然后我们就好好的分析一下他的原理,到底是如何对这些数据进行编码的。

二、Base64原理

1、Base64编码

Base64的原理超级简单,相信我们都知道ASCII 编码,从A-Z、a-z、0-9和一些其他的特殊字符,这些字符都有唯一的一个数字来表示。比如说a是97,A是65。我们来截取一部分图看一下:

 

 

同理Base64也有这样一套编码。范围是”A-Z“、”a-z“、”0-9“、”+“、”/“一共64个字符。我们给出一个表格来看一下,这个比ASCII编码要简单多了,只有64个。

 

 

由于索引是从0开始,所以最后的索引是63。在编码的时候Base64就是通过上面的进行转换编码的。下面我们就来看看Base64编码的原理。

2、基本原理

比如说有一封邮件,我们想要对其使用Base64进行编码。怎么办呢?基本步骤如下:

(1)对邮件的数据进行切分,每三个字节一组,一共24个bit。

(2)对切分后的数据重组,24个bit重组为4组,每组6个bit

(3)对重组后的数据处理,每组最前面添加两个“0”,构成每组8个bit。此时一共32个bit。

(4)根据Base64编码表,获取相应的编码值。

此时一封完整的邮件,被切分重组处理之后就变成了Base64编码了。基本原理其实很简单。不过你不理解也没关系,我们直接上个实例来解释一下。

3、实例验证

比如说电子邮件里面出现了三个字母sky。我们要对这个三个字符使用Base64进行编码。

(1)对邮件的数据进行切分,每三个字节一组,一共24个bit

 

 

(2)对切分后的数据重组,24个bit重组为4组,每组6个bit

 

(3)对重组后的数据处理,每组最前面添加两个“0”,构成每组8个bit。由于在最前面添加的0,所以对数值不构成影响。

(4)根据Base64编码表,获取相应的编码值

 

(5)完成编码的转换

 

到这我们基本上就是实现了Base64编码机制从sky到c2t5的转换。

       例:字符串“Xue”经过Base64编码后变为“WHVl”。

  1. 长度为3个字节的数据位数是8*3=24,可以精确地分成6*4。

    如果数据的字节数不是3的倍数,则其位数就不是6的倍数,那么需要就不能精确地划分成6位的块。,

    此时,需在原数据后面添加1个或2个零值字节,使其字节数是3的倍数。

    然后,在编码后的字符串后面添加1个或2个等号“=”,表示所添加的零值字节数。

    BASE64编码简介,怎么进行BASE64编码
    例:字符串“Xu”经过Base64编码后变为“WHU=”。
  2.       字符串“X”经过Base64编码后变为“WA==”。

    BASE64编码简介,怎么进行BASE64编码
    BASE64编码简介,怎么进行BASE64编码
     

 

有些地方需要我们去注意一下:

(1)关于6个0变=号的,如果所有的0都是补出来的,就用=,否则用A填充

(2)上面的例子中,我们使用的是ASCII编码,但是如果我们使用UTF-8,对应Base64编码的结果是不一样的。

(3)Base64只是进行了编码,方便数据的传输而已。这可不是加密。

原理也搞清楚了,现在我们就实现一下。

三、代码实现

你可以自己去实现一个编码解码的完整过程,但是java已经为我们封装好了,我们直接只用别人造好的轮子多好。不管是自己写还是使用别人的,原理搞清楚就OK了。

 

是不是很简单。其实java实现的方式有很多种,其他的还有Commons Codec和Bouncy Castle。实现的过程和JDK提供的类似,我们只需要导入相应的jar包即可。

Base64算法的应用场景有E-Mail、密钥、证书文件等等。这也只是入门,想要深入了解,可以看一些安全有关的书籍,不过很多都和数学有关,看的实在是难受,曾经看过,可惜没坚持住。惭愧,书到用时方恨少。

OK。有问题还请指正。

posted @ 2020-04-17 10:20  西凤楼  阅读(568)  评论(0编辑  收藏  举报
如果,您认为阅读这篇博客让您有些收获, 如果,您希望更容易地发现我的新博客,不妨关注一下。因为,我的写作热情也离不开您的肯定支持。 感谢您的阅读,如果您对我的博客所讲述的内容有兴趣,请继续关注我的后续博客。 因为有小孩,兼职卖书,路过的朋友有需要低价购买图书、点读笔、纸尿裤等资源的,可扫最上方二维码,质量有保证,价格很美丽,欢迎咨询!