python之模块Ⅱ
模块Ⅱ
-
序列化模块(重点)
-
定义:将一个数据类型结构(list,dict...)转化成一个特殊的序列(特殊的字符串)的过程。
在文件存储和文件传输时有时会遇到,将原数据结构转化为str()存储在文件,或转化为bytes通过网络传输后,在读取文件或接收到文件后无法转换为原数据结构。通过序列化模块可将原数据类型转化为一种特殊的字符串,这个字符串可以与任何的数据结构相互转换。
-
序列化模块的分类
序列化模块可将一种数据结构转化为特殊的序列(字符串、bytes)并且还可以转换回去。目前序列化模块有三种:json模块,pickle模块,shevle模块
-
json序列化
是所有语言公认的最常用的一种序列,但是支持的python数据结构有限
可分为两对四个方法:
-
dumps,loads主要用于网络传输,也可以用于文件的存取
import json dic = {'username': '王大锤', 'password': 123,'status': False} ret = json.dumps(dic)#序列化:将一个字典转换成一个字符串 print(ret,type(ret)) #{"username": "\u738b\u5927\u9524", "password": 123, "status": false} <class 'str'> #注意,json转换完的字符串类型的字典中的字符串是由""表示的 ret_dict = json.loads(ret)#反序列化:将一个字符串格式的字典转换成一个字典 print(ret_dict) #{'username': '王大锤', 'password': 123, 'status': False} #注意,要用json的loads功能处理的字符串类型的字典中的字符串必须由""表示
可传递参数:
dic = {'username': '王大锤', 'password': 123,'status': False} ret = json.dumps(dic,ensure_ascii=False,sort_keys=True) print(ret,type(ret)) #{"password": 123, "status": false, "username": "王大锤"} <class 'str'>
其他参数说明:ensure_ascii:,当它为True的时候,所有非ASCII码字符显示为\uXXXX序列,只需在dump时将ensure_ascii设置为False即可,此时存入json的中文即可正常显示。 separators:分隔符,实际上是(item_separator, dict_separator)的一个元组,默认的就是(‘,’,’:’);这表示dictionary内keys之间用“,”隔开,而KEY和value之间用“:”隔开。 sort_keys:将数据根据keys的值进行排序。
存取文件:
import json dic = {'username': '王大锤', 'password': 123,'status': False} s_dict = json.dumps(dic) with open('jsonlx.json',encoding='utf-8',mode='w') as f1: f1.write(s_dict) with open('jsonlx.json',encoding='utf-8') as f2: content = f2.read() print(json.loads(content))
-
dump,load用于文件存取
import json f = open('json_file.json','w') dic = {'k1':'v1','k2':'v2','k3':'v3'} json.dump(dic,f) #dump方法接收一个文件句柄,直接将字典转换成json字符串写入文件 f.close() # json文件也是文件,就是专门存储json字符串的文件。 f = open('json_file.json') dic2 = json.load(f) #load方法接收一个文件句柄,直接将文件中的json字符串转换成数据结构返回 f.close() print(type(dic2),dic2)
-
将多个数据存储到文件中
import json dic1 = {'username': '王大锤', 'password': 123,'status': False} dic2 = {'username': 'abc', 'password': 123,'status': False} dic3 = {'username': 'ly', 'password': 123,'status': False} with open('jsonmore.json',encoding='utf-8',mode='a') as f1: f1.write(f'{json.dumps(dic1)}\n{json.dumps(dic2)}\n{json.dumps(dic3)}') with open('jsonmore.json',encoding='utf-8') as f1: for line in f1: ret = json.loads(line) print(ret,type(ret))
-
-
pickle序列化
-
dumps,loads只能用于网络传输
import pickle l1 = ['wusir', '太白', '小黑', 666] ret = pickle.dumps(l1) print(ret) #b'\x80\x03]q\x00(X\x06\x00\x00\x00\xe5\xb0\x8f\xe9\xbb\x91q\x01M\x9a\x02e.' l2 = pickle.loads(ret) print(l2,type(l2)) ['小黑', 666] <class 'list'>
-
dump,load只能用于文件存取
import pickle l1 = ['wusir', '太白', '小黑', 666] with open('pickle练习.pickle',mode='wb') as f1: pickle.dump(l1,f1) with open('pickle练习.pickle', mode='rb') as f1: ret = pickle.load(f1) print(ret,type(ret))
-
多个数据写入
# 多个数据写入文件 l1 = ['wusir', '太白', '小黑1', 666] l2 = ['wusir', '太白', '小黑2', 666] l3 = ['wusir', '太白', '小黑3', 666] with open('pickle练习1.pickle',mode='wb') as f1: pickle.dump(l1,f1) pickle.dump(l2,f1) pickle.dump(l3,f1) with open('pickle练习1.pickle', mode='rb') as f1: ret1 = pickle.load(f1) ret2 = pickle.load(f1) ret3 = pickle.load(f1) print(ret1,ret2,ret3)
-
-
-
-
os模块
-
与工作目录(当前目录、父级目录)有关的
import os print(os.getcwd()) # 获取当前工作目录,即当前python脚本工作的目录路径 ** os.chdir(r'D:\s23\day9')# 改变当前脚本工作目录;相当于shell下cd ** os.curdir # 返回当前目录: ('.') ** os.pardir # 获取当前目录的父目录字符串名:('..') **
-
和文件夹相关 ***
os.makedirs('dirname1/dirname2') #可生成多层递归目录 *** os.removedirs('dirname1') #若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推 *** os.mkdir('dirname') #生成单级目录;相当于shell中mkdir dirname *** os.rmdir('dirname') #删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname *** os.listdir('dirname') #列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印 **
-
和文件相关
os.remove() #删除一个文件 *** os.rename("oldname","newname") #重命名文件/目录 *** os.stat('path/filename') #获取文件/目录信息 **
-
和路径相关
os.path.abspath(path) #返回path规范化的绝对路径 *** os.path.split(path) #将path分割成目录和文件名二元组返回 *** os.path.dirname(path) #返回path的目录。其实就是os.path.split(path)的第一个元素 ** os.path.basename(path) #返回path最后的文件名。如何path以/或\结尾,那么就会返回空值,即os.path.split(path)的第二个元素。 ** os.path.exists(path) #如果path存在,返回True;如果path不存在,返回False *** os.path.isabs(path) #如果path是绝对路径,返回True ** os.path.isfile(path) #如果path是一个存在的文件,返回True。否则返回False *** os.path.isdir(path) #如果path是一个存在的目录,则返回True。否则返回False *** os.path.join(path1[, path2[, ...]]) #将多个路径组合后返回,第一个绝对路径之前的参数将被忽略 *** os.path.getatime(path) #返回path所指向的文件或者目录的最后访问时间 ** os.path.getmtime(path) #返回path所指向的文件或者目录的最后修改时间 ** os.path.getsize(path) #返回path的大小 ***
-
-
sys模块
sys模块是与python解释器交互的一个接口
sys.argv #命令行参数List,第一个元素是程序本身路径 sys.exit(n) #退出程序,正常退出时exit(0),错误退出sys.exit(1) sys.version #获取Python解释程序的版本信息 sys.path #返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值 *** sys.platform #返回操作系统平台名称
-
hashlib模块
-
定义:加密模块、摘要算法、散列算法等等,他是一堆加密算法的集合
-
hashlib如何加密
- 将一个bytes类型的数据通过hashlib进行加密,返回一个等长度的16进制数字
- 过程不可逆
- 相同的bytes类型的数据通过相同加密方法得到的数字绝对相同
- 不相同的bytes类型的数据通过相同加密方法得到的数字绝对不相同
-
用途
-
文件加密,md5加密级别是最低的,sha系列安全系数高,耗时高。
import hashlib md5 = hashlib.md5() md5.update('123456'.encode('utf-8')) print(md5.hexdigest()) # 'e10adc3949ba59abbe56e057f20f883e'
加固定的盐
ret = hashlib.md5('xxx公司'.encode('utf-8')) ret.update('123456'.encode('utf-8')) s = ret.hexdigest() print(s,type(s)) # 1ef97f2f10b2ba2dc273a9641cd713d2 <class 'str'>
加动态的盐
username = input('输入用户名:').strip() password = input('输入密码').strip() ret = hashlib.md5(username[::2].encode('utf-8')) ret.update(password.encode('utf-8')) s = ret.hexdigest() print(s)
-
文件一致性校验
import hashlib def md5_file(path): ret = hashlib.md5() with open(path,mode='rb') as f1: while 1: content = f1.read(1024) if content: ret.update(content) else: return ret.hexdigest()
-
-
-
time模块
三种表示方式:时间戳(timestamp)、格式化的时间字符串(Format String)、元组(struct_time)
-
时间戳
import time print(time.time()) # 1561713996.1833062
-
时间字符串
import time print(time.strftime('%y-%m-%d %H:%M:%S')) # 19-06-28 17:27:27
-
结构化时间
localtime将一个时间戳转换为当前时区的struct_time
import time timestamp = time.time() st = time.localtime(timestamp) print(st) # time.struct_time(tm_year=2019, tm_mon=6, tm_mday=28, tm_hour=17, tm_min=34, tm_sec=33, tm_wday=4, tm_yday=179, tm_isdst=0)
格式化时间 ----> 时间戳
ft = time.strftime('%Y/%m/%d %H:%M:%S') st = time.strptime(ft,'%Y/%m/%d %H:%M:%S') print(st) # 转化为结构化时间 timestamp = time.mktime(st) print(timestamp) # 转化为时间戳 # time.struct_time(tm_year=2019, tm_mon=6, tm_mday=28, tm_hour=17, tm_min=35, tm_sec=55, tm_wday=4, tm_yday=179, tm_isdst=-1) #1561714737.0
时间戳 ---> 结构化时间
t = time.time() st = time.localtime(t) print(st) # 转化为结构化时间 ft = time.strftime('%Y/%m/%d %H:%M:%S',st) print(ft) # 转化为格式化时间 # time.struct_time(tm_year=2019, tm_mon=6, tm_mday=28, tm_hour=17, tm_min=42, tm_sec=55, tm_wday=4, tm_yday=179, tm_isdst=0) # 19-06-28 17:42:55
-
-
datetime模块
# datatime模块 import datetime now_time = datetime.datetime.now() # 现在的时间 # 只能调整的字段:weeks days hours minutes seconds print(datetime.datetime.now() + datetime.timedelta(weeks=3)) # 三周后 print(datetime.datetime.now() + datetime.timedelta(weeks=-3)) # 三周前 current_time = datetime.datetime.now() # 可直接调整到指定的 年 月 日 时 分 秒 等 print(current_time.replace(year=1977)) # 直接调整到1977年 print(current_time.replace(month=1)) # 直接调整到1月份 print(current_time.replace(year=1989,month=4,day=25)) # 1989-04-25 18:49:05.898601 # 将时间戳转化成时间 print(datetime.date.fromtimestamp(1232132131)) # 2009-01-17
-
random模块
>>> import random #随机小数 >>> random.random() # 大于0且小于1之间的小数 0.7664338663654585 >>> random.uniform(1,3) #大于1小于3的小数 1.6270147180533838 #随机整数 >>> random.randint(1,5) # 大于等于1且小于等于5之间的整数 >>> random.randrange(1,10,2) # 大于等于1且小于10之间的奇数 #随机选择一个返回 >>> random.choice([1,'23',[4,5]]) # #1或者23或者[4,5] #随机选择多个返回,返回的个数为函数的第二个参数 >>> random.sample([1,'23',[4,5]],2) # #列表元素任意2个组合 [[4, 5], '23'] #打乱列表顺序 >>> item=[1,3,5,7,9] >>> random.shuffle(item) # 打乱次序 >>> item [5, 1, 3, 7, 9] >>> random.shuffle(item) >>> item [5, 9, 7, 1, 3]