python模块之hashlib模块
hashlib模块
加密:将明文数据通过一系列算法变成密文数据。
# 其目的就是为了让数据更加的安全
加密算法:md系列 sha系列 base系列 hmac系列
基本使用
import hashlib
1.先确定算法类型 # (md5普遍使用)
md5 = hashlib.md5()
2.将明文数据传递给md5算法 # (update只能接受bytes类型数据)
md5.update('xxx'.encode('utf8'))
3.获取加密之后的密文数据 # 其是一串没有规则的随机字符串
res = md5.hexdigest()
print(res)
"""
1.加密之后的密文数据是没有办法反解密成明文数据的
市面上所谓的破解 其实就是提前算出一系列明文对应的密文
之后比对密文再获取明文
"""
详细操作
1.明文数据只要是相同的 那么无论如何传递加密结果肯定是一样的
import hashlib
# 1.先确定算法类型(md5普遍使用)
md5 = hashlib.md5()
# 2.将明文数据传递给md5算法(update只能接受bytes类型数据)
md5.update('xxx'.encode('utf8'))
# 3.获取加密之后的密文数据(没有规则的一串随机字符串)
res = md5.hexdigest()
print(res) # f561aaf6ef0bf14d4208bb46a4ccb3ad
2.密文数据越长表示内部对应的算法越复杂 越难被正向破解
import hashlib
# 1.先确定算法类型(md5普遍使用)
md5 = hashlib.sha256() # 此处使用sha256()
# 2.将明文数据传递给md5算法(update只能接受bytes类型数据)
md5.update(b'123') # 可直接用b+字符串转为二进制
# 3.获取加密之后的密文数据(没有规则的一串随机字符串)
res = md5.hexdigest()
print(res) # 6ec0f865ec4e9bcf9abc7f6c0e7268acfb2ba36f3e460fd592a214f7eacc92b0
##########
密文越长表示算法越复杂 对应的破解算法的难度越高
但是越复杂的算法所需要消耗的资源也就越多 密文越长基于网络发送需要占据的数据也就越大
具体使用什么算法取决于项目的要求 一般情况下md5足够了
3.实用场景:涉及到用户密码存储 其实都是密文 只要用户自己知道明文是什么
1.内部程序员无法得知明文数据
2.数据泄露也无法得知明文数据
eg:ATM购物车练习 用户密码采取的就是密文存取
4.加盐处理
# 在对明文数据做加密处理过程前添加一些干扰项
password = input('密码>>>')
# # 1.先确定算法类型(md5普遍使用)
md5 = hashlib.md5()
# # 2.将明文数据传递给md5算法(update只能接受bytes类型数据)
# # 加盐(干扰项)
md5.update('加盐了'.encode('utf8'))
# 真实数据
md5.update(password.encode('utf8'))
# # 3.获取加密之后的密文数据(没有规则的一串随机字符串)
res = md5.hexdigest()
print(res)
5.动态加盐
# 在对明文数据做加密处理过程前添加一些变化的干扰项
但是每次运行干扰项是不同的
故:这里可以用到time.time()作为干扰项
这样每次运行时间戳都不一样 干扰项也就为动态的
password = input('密码>>>')
# # 1.先确定算法类型(md5普遍使用)
md5 = hashlib.md5()
# # 2.将明文数据传递给md5算法(update只能接受bytes类型数据)
# # 加盐(干扰项)
import time
res = str(time.time()) # 因只有字符串才可以转为二进制 故这里需要将时间戳改为字符串类型
md5.update(res.encode('utf8'))
# 真实数据
md5.update(password.encode('utf8'))
# # 3.获取加密之后的密文数据(没有规则的一串随机字符串)
res = md5.hexdigest()
print(res)
6.校验文件一致性
文件不是很大的情况下 可以将所有文件内部全部加密处理
但是如果文件特别大 全部加密处理相当的耗时好资源 如何解决???
针对大文件可以使用切片读取的方式
import hashlib
md5 = hashlib.md5()
with open(r'a.txt','rb') as f:
for line in f:
md5.update(line)
real_data = md5.hexdigest()
print(real_data) # 29d8ea41c610ee5d1e76dd0a42c7e60a
with open(r'a.txt','rb') as f:
for line in f:
md5.update(line)
error_data = md5.hexdigest()
print(error_data) # 738a56b49f24884ba758d1e4ab6ceb74
import os
# 读取文件总大小
res = os.path.getsize(r'a.txt')
# 指定分片读取策略(读几段 每段几个字节) 10 f.seek()
read_method = [0,res//4,res//2,res]
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· winform 绘制太阳,地球,月球 运作规律
· 上周热点回顾(3.3-3.9)