027_hashlib模块(摘要算法)
1,算法介绍
Python的hashlib提供了常见的摘要算法,如MD5,SHA1等等。
什么是摘要算法呢?摘要算法又称哈希算法、散列算法。它通过一个函数,把任意长度的数据转换为一个长度固定的数据串(通常用16进制的字符串表示)。
摘要算法就是通过摘要函数f()对任意长度的数据data计算出固定长度的摘要digest,目的是为了发现原始数据是否被人篡改过。
摘要算法之所以能指出数据是否被篡改过,就是因为摘要函数是一个单向函数,计算f(data)很容易,但通过digest反推data却非常困难。而且,对原始数据做一个bit的修改,都会导致计算出的摘要完全不同。
1.1,我们以常见的摘要算法MD5为例,计算出一个字符串的MD5值:
1 | import hashlib # 提供摘要算法的模块md5 = hashlib.md5()md5.update('how to use md5 in python hashlib?')print md5.hexdigest()计算结果如下:d26a53750bc40b38b65a520292f69306 |
1.2,如果数据量很大,可以分块多次调用update(),最后计算的结果是一样的:
1 2 3 4 | md5 = hashlib.md5() md5.update( 'how to use md5 in ' ) md5.update( 'python hashlib?' ) print md5.hexdigest() |
1.3,MD5是最常见的摘要算法,速度很快,生成结果是固定的128 bit字节,通常用一个32位的16进制字符串表示。另一种常见的摘要算法是SHA1,调用SHA1和调用MD5完全类似:
1 2 3 4 5 6 | import hashlib sha1 = hashlib.sha1() sha1.update( 'how to use sha1 in ' ) sha1.update( 'python hashlib?' ) print sha1.hexdigest() |
SHA1的结果是160 bit字节,通常用一个40位的16进制字符串表示。比SHA1更安全的算法是SHA256和SHA512,不过越安全的算法越慢,而且摘要长度更长。
2,概括与使用
2.1,
- 不管算法多么不同,摘要的功能始终不变
- 对于相同的字符串使用同一个算法进行摘要,得到的值总是不变的
- 使用不同算法对相同的字符串进行摘要,得到的值应该不同
- 不管使用什么算法,hashlib的方式永远不变
2.2,摘要算法使用
- 密码的密文存储
- 文件的一致性验证
- 在下载的时候
# 检查我们下载的文件和远程服务器上的文件是否一致
# 两台机器上的两个文件 你想检查这两个文件是否相等
3, 注册
# 用户注册
# 用户 输入用户名
# 用户输入 密码
# 明文的密码进行摘要 拿到一个密文的密码
# 写入文件
# 用户的登录
1 2 3 4 5 6 7 8 9 10 11 | import hashlib usr = input ( 'username :' ) pwd = input ( 'password : ' ) with open ( 'userinfo' ) as f: for line in f: user,passwd,role = line.split( '|' ) md5 = hashlib.md5() md5.update(bytes(pwd,encoding = 'utf-8' )) md5_pwd = md5.hexdigest() if usr = = user and md5_pwd = = passwd: print ( '登录成功' ) |
4,加盐
虽然不可以解密,但是过于简单的密码可以通过“撞库”得到原密码,即将一些可能的密码经过摘要后存入库中,在拿需要解密的密码的摘要对比,得到原密码。
为解决这一个问题,可以使用“加盐”的方式使摘要结果复杂。
4.1, 加盐
1 2 3 4 5 | import hashlib # 提供摘要算法的模块 md5 = hashlib.md5(bytes( '盐' ,encoding = 'utf-8' )) # md5 = hashlib.md5() #原来的方式,不加盐的方式 md5.update(b '123456' ) print (md5.hexdigest()) |
4.2,动态加盐
使用用户名的一部分或者 直接使用整个用户名作为盐
1 2 3 4 5 | import hashlib # 提供摘要算法的模块 md5 = hashlib.md5(bytes( '盐' ,encoding = 'utf-8' ) + b'') # md5 = hashlib.md5() #原来的方式,不加盐的方式 md5.update(b '123456' ) print (md5.hexdigest()) |
5,文件的一致性校验
# 文件的一致性校验这里不需要加盐
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步