【转】Byte[ ]和Base64之间的转换(加密)

Python 2.7中的str是字节串,而Python 3.x中的str是字符串

经常听到有人说“base64加密”,其实base64并不能用于数据加密,它也不是为了纯粹的数据加密而生的,它的出现是为了解决不可见字符串的网络传输和数据保存问题。因为,用base64对数据进行转换的过程不能成为“加密”与“解密”,只能成为“编码”与“解码”。

Base64是一种用64个字符来表示任意二进制数据的方法,它是一种通过查表对二进制数据进行编码的方法,不能用于数据加密。base64最初的出现时为了能够正确的传输邮件数据,因为邮件中的附件(比如图片)的二进制数中可能存在不可见字符(ascii码中128-255之间的值是不可见字符),比如我们尝试用记事本或其他文本编辑器打开一个图片时,通常都会看到一大堆乱码,这些乱码就是不可见字符。由于早期的一些网络设备和网络协议是无法正确识别这些字符的,这就可能在数据传输时出现各种无法预知的问题。base64的作用就是把含有不可见字符的信息用可见字符来表示(Ascii码中0-127之间的值是可见字符),从而解决这个问题

Base64.encodeToString(str.getBytes())

它其实是使用 a-z, A-Z, 0-9, /, + 这64个字符来进行编码的,0-63分别对应用前面的64个字符来表示。

其编码结果的特点是:末尾可能有1个或者2个 = :

Pz8/aGVsbG8vc2FzZXdyZWRmZGQ+Pj4uIEhlbGxvIOS4lueVjO+8gQ==

其原因是,Base64编码算法是每次处理byte[]数组中三个连续的byte,那么就有可能 byte[] 数组不是3的整数倍,那么余数就有可能是1,或者2,所以就分别使用 一个 = 和两个 = 来进行填充。

所以:

Base64的编码其特点就是可能末尾有一个或者两个=,可能含有 / 和 + 字符。

16进制编码的特点是全部由'0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'a', 'b', 'c', 'd', 'e', 'f' 这16个字符组成,不含其他字母。

加密算法都是对byte[]进行变换和运算。

有 String 转换得到的 byte[] 就一定可以使用原来的编码方案转换成原来的 String,

但是加密的结果 byte[] 却不能用任何字符编码方案得到String, 一般使用16进制编码成String,然后进行存储或者比较。

base64.b64encode(s, altchars=None)对二进制数据(字节串)s通过base64进行编码,返回编码后的字节串

base64.b64decode(s, altchars=None, validate=False)对通过base64编码的字节对象或ASCII字符串s进行解码,返回解码后的字节串

base64.urlsafe_b64encode(s)与b64encode()函数不同的是,它会把标准Base64编码结果中的字符'+'和字符'/'分别替换成字符'-'和字符'_'。

base64.urlsafe_b64decode(s)解码通过base64.urlsafe_b64encode()函数编码的字节对象或ASCII字符串s。

 

当判断字符串是否是base64加密过的,或者要将字符串进行加密。

特别是爬虫过程中,js中经常带有base64进行加密解密的操作,只要知道整个逻辑,以后可以直接进行调用。

def jiemi_base64(): # 解密base64

    data = 'eyduYW1lJzona2trJywnYWdlJzoyMn0='

    # data= '''{'aa':'bb'}'''

    missing_padding = 4- len(data) %4

    if missing_padding:

        data += '=' * missing_padding

    print(base64.b64decode(data))

    print(type(base64.b64decode(data)))

    #b"{'name':'kkk','age':22}"

    #<class 'bytes'>

def jiami_base64(): # 加密base64

    data= "{'name':'kkk','age':22}"

    print(base64.b64encode(data.encode()))  # data必须是bytes类型,如果是字符串,则通过encode()转换

    # b'eyduYW1lJzona2trJywnYWdlJzoyMn0='

if __name__ == '__main__':

    # jiami_base64()

    jiemi_base64()

 

 

由于‘z’后面bit位都是0,base64约定以‘=’代替

上述还可以写为:

以24位,8位分割表示:

01111010     00000000     00000000

以24位,6位分割表示:

011110    100000    000000    000000

6位如何以8位形式表示,在前面补0,即:

0001 1110    0010 0000    0000 0000    0000 0000

得到上述结果

因此,‘z’经过base64编码得到:‘eg==’

用python验证一下:

>>> base64.b64encode("z")

'eg=='

---------------------

作者:zhubaoJay

来源:CSDN

原文:https://blog.csdn.net/zhubaoJay/article/details/72957135

版权声明:本文为博主原创文章,转载请附上博文链接!

posted @ 2022-04-28 10:09  zzljh  阅读(1996)  评论(0编辑  收藏  举报