【转】Byte[ ]和Base64之间的转换(加密)
Python 2.7中的str是字节串,而Python 3.x中的str是字符串
经常听到有人说“base64加密”,其实base64并不能用于数据加密,它也不是为了纯粹的数据加密而生的,它的出现是为了解决不可见字符串的网络传输和数据保存问题。因为,用base64对数据进行转换的过程不能成为“加密”与“解密”,只能成为“编码”与“解码”。
Base64是一种用64个字符来表示任意二进制数据的方法,它是一种通过查表对二进制数据进行编码的方法,不能用于数据加密。base64最初的出现时为了能够正确的传输邮件数据,因为邮件中的附件(比如图片)的二进制数中可能存在不可见字符(ascii码中128-255之间的值是不可见字符),比如我们尝试用记事本或其他文本编辑器打开一个图片时,通常都会看到一大堆乱码,这些乱码就是不可见字符。由于早期的一些网络设备和网络协议是无法正确识别这些字符的,这就可能在数据传输时出现各种无法预知的问题。base64的作用就是把含有不可见字符的信息用可见字符来表示(Ascii码中0-127之间的值是可见字符),从而解决这个问题
Base64.encodeToString(str.getBytes())
它其实是使用 a-z, A-Z, 0-9, /, + 这64个字符来进行编码的,0-63分别对应用前面的64个字符来表示。
其编码结果的特点是:末尾可能有1个或者2个 = :
Pz8/aGVsbG8vc2FzZXdyZWRmZGQ+Pj4uIEhlbGxvIOS4lueVjO+8gQ==
其原因是,Base64编码算法是每次处理byte[]数组中三个连续的byte,那么就有可能 byte[] 数组不是3的整数倍,那么余数就有可能是1,或者2,所以就分别使用 一个 = 和两个 = 来进行填充。
所以:
Base64的编码其特点就是可能末尾有一个或者两个=,可能含有 / 和 + 字符。
16进制编码的特点是全部由'0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'a', 'b', 'c', 'd', 'e', 'f' 这16个字符组成,不含其他字母。
加密算法都是对byte[]进行变换和运算。
有 String 转换得到的 byte[] 就一定可以使用原来的编码方案转换成原来的 String,
但是加密的结果 byte[] 却不能用任何字符编码方案得到String, 一般使用16进制编码成String,然后进行存储或者比较。
base64.b64encode(s, altchars=None)对二进制数据(字节串)s通过base64进行编码,返回编码后的字节串
base64.b64decode(s, altchars=None, validate=False)对通过base64编码的字节对象或ASCII字符串s进行解码,返回解码后的字节串
base64.urlsafe_b64encode(s)与b64encode()函数不同的是,它会把标准Base64编码结果中的字符'+'和字符'/'分别替换成字符'-'和字符'_'。
base64.urlsafe_b64decode(s)解码通过base64.urlsafe_b64encode()函数编码的字节对象或ASCII字符串s。
当判断字符串是否是base64加密过的,或者要将字符串进行加密。
特别是爬虫过程中,js中经常带有base64进行加密解密的操作,只要知道整个逻辑,以后可以直接进行调用。
def jiemi_base64(): # 解密base64
data = 'eyduYW1lJzona2trJywnYWdlJzoyMn0='
# data= '''{'aa':'bb'}'''
missing_padding = 4- len(data) %4
if missing_padding:
data += '=' * missing_padding
print(base64.b64decode(data))
print(type(base64.b64decode(data)))
#b"{'name':'kkk','age':22}"
#<class 'bytes'>
def jiami_base64(): # 加密base64
data= "{'name':'kkk','age':22}"
print(base64.b64encode(data.encode())) # data必须是bytes类型,如果是字符串,则通过encode()转换
# b'eyduYW1lJzona2trJywnYWdlJzoyMn0='
if __name__ == '__main__':
# jiami_base64()
jiemi_base64()
由于‘z’后面bit位都是0,base64约定以‘=’代替
上述还可以写为:
以24位,8位分割表示:
01111010 00000000 00000000
以24位,6位分割表示:
011110 100000 000000 000000
6位如何以8位形式表示,在前面补0,即:
0001 1110 0010 0000 0000 0000 0000 0000
得到上述结果
因此,‘z’经过base64编码得到:‘eg==’
用python验证一下:
>>> base64.b64encode("z")
'eg=='
---------------------
作者:zhubaoJay
来源:CSDN
原文:https://blog.csdn.net/zhubaoJay/article/details/72957135
版权声明:本文为博主原创文章,转载请附上博文链接!