一。包
在模块的定义里,模块就是方法的集合,可以将一些常用的方法封装到一个py文件中,通过调用使用,而且,其中的表现形式也有以包的形式导入。
其实,包就是一系列模块的结合体,表示形式就是一个文件夹,在文件夹中有一个__init__py文件。
init文件就是将包中的方法全部集合 的地方,使用者使用包的时候就是通过运行init文件。
在init文件中可以使用两种方法调用包里的方法:
import p.m1 from p.m1 import f1
当文件启动时:首次导入包:先产生一个执行文件的名称空间
1.创建包下面的__init__.py文件的名称空间
2.执行包下面的__init__.py文件中的代码 将产生的名字放入包下面的__init__.py文件名称空间中
3.在执行文件中拿到一个指向包下面的__init__.py文件名称空间的名字。
而无论是import 还是from import都需要以起始运行文件为参照。
为了更加方便的管理包,作为包的设计者来说
1.当模块的功能特别多的情况下 应该分文件管理
2.每个模块之间为了避免后期模块改名的问题 你可以使用相对导入(包里面的文件都应该是被导入的模块)
我总结了几个使用包的方法:
1.在写包的时候,将所有的模块中的方法都写到init中,在调用包的时候就可以直接调用方法。
2.在调用包的阶段索引包的位置导入包的模块,然后再使用模块中的方法。
而包也有相对路径和绝对路径 之分
站在包的开发者角度来说,如果使用绝对路径来管理的自己的模块 那么它只需要永远以包的路径为基准依次导入模块站。
在包的使用者你必须得将包所在的那个文件夹路径添加到system path中。
在py2和py3中也有对于包不同的地方:
python2如果要导入包 包下面必须要有__init__.py文件
python3如果要导入包 包下面没有__init__.py文件也不会报错
当你在删程序不必要的文件的时候 千万不要随意删除__init__.py文件。
二。logging模块(日志模块)
记录事务的模块
日志分为5个等级,从10-50从轻到重。
logging.debug('debug日志') # 10 logging.info('info日志') # 20 logging.warning('warning日志') # 30 logging.error('error日志') # 40 logging.critical('critical日志') # 50
日志的生成
import logging
logging.basicConfig(filename='access.log',
format='%(asctime)s - %(name)s - %(levelname)s -%(module)s: %(message)s',
datefmt='%Y-%m-%d %H:%M:%S %p',
level=10,
)
filename是文件名,format是生成日志的格式,datefmt是时间的格式,level设置的是日志错误显示的的等级下线。最后生成一个文件。
如果在终端打印是可以将stream参数变成true,而且不能与filename一起使用。
4个logging对象
1.logger对象:负责产生日志。
2.filter对象:过滤日志
3.handler对象:控制日志输出的位置(文件/终端)
4.formmater对象:规定日志内容的格式。
在handler对象中可以设置日志对象输出的方向:
hd1 = logging.FileHandler('a1.log',encoding='utf-8') # 输出到文件中 hd2 = logging.FileHandler('a2.log',encoding='utf-8') # 输出到文件中 hd3 = logging.StreamHandler() # 输出到终端
可以设置多个对象。
在规定formmater对象中可以规定日志内容的格式。:
fm1 = logging.Formatter( fmt='%(asctime)s - %(name)s - %(levelname)s -%(module)s: %(message)s', datefmt='%Y-%m-%d %H:%M:%S %p', )
formmate中用到的格式:
logging.basicConfig()函数中可通过具体参数来更改logging模块默认行为,可用参数有: filename:用指定的文件名创建FiledHandler,这样日志会被存储在指定的文件中。 filemode:文件打开方式,在指定了filename时使用这个参数,默认值为“a”还可指定为“w”。 format:指定handler使用的日志显示格式。 datefmt:指定日期时间格式。 level:设置rootlogger(后边会讲解具体概念)的日志级别 stream:用指定的stream创建StreamHandler。可以指定输出到sys.stderr,sys.stdout或者文件(f=open(‘test.log’,’w’)),默认为sys.stderr。若同时列出了filename和stream两个参数,则stream参数会被忽略。 format参数中可能用到的格式化串: %(name)s Logger的名字 %(levelno)s 数字形式的日志级别 %(levelname)s 文本形式的日志级别 %(pathname)s 调用日志输出函数的模块的完整路径名,可能没有 %(filename)s 调用日志输出函数的模块的文件名 %(module)s 调用日志输出函数的模块名 %(funcName)s 调用日志输出函数的函数名 %(lineno)d 调用日志输出函数的语句所在的代码行 %(created)f 当前时间,用UNIX标准的表示时间的浮 点数表示 %(relativeCreated)d 输出日志信息时的,自Logger创建以 来的毫秒数 %(asctime)s 字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒 %(thread)d 线程ID。可能没有 %(threadName)s 线程名。可能没有 %(process)d 进程ID。可能没有 %(message)s用户输出的消息
同样,也可以设置多个对象。
然后,需要对logger对象进行绑定handler
logger.addHandler(hd1) logger.addHandler(hd2) logger.addHandler(hd3) #将hd1,2,3绑定到logger,规定输出方向
后面再对其格式进行绑定:
hd1.setFormatter(fm1) hd2.setFormatter(fm2) hd3.setFormatter(fm1) #对hd对象绑定格式。
设置日志等级
logger.setLevel(20)
最后记录日志
logger.debug('写了半天 好累啊 好热啊 好想释放')
logger,handler,formmate三者的关系如下:
logger可以给多个handler对象,一个formate也可以修饰多个handler,最后由handler对象输出到该输出的位置。
上述过程就是将日志文件生成log的过程,很麻烦,所以可以使用日志字典来处理:
import os import logging.config # 定义三种日志输出格式 开始 standard_format = '[%(asctime)s][%(threadName)s:%(thread)d][task_id:%(name)s][%(filename)s:%(lineno)d]' \ '[%(levelname)s][%(message)s]' #其中name为getlogger指定的名字 simple_format = '[%(levelname)s][%(asctime)s][%(filename)s:%(lineno)d]%(message)s' # 定义日志输出格式 结束 """ 下面的两个变量对应的值 需要你手动修改 """ logfile_dir = os.path.dirname(__file__) # log文件的目录 logfile_name = 'a3.log' # log文件名 # 如果不存在定义的日志目录就创建一个 if not os.path.isdir(logfile_dir): os.mkdir(logfile_dir) # log文件的全路径 logfile_path = os.path.join(logfile_dir, logfile_name) # log配置字典 LOGGING_DIC = { 'version': 1, 'disable_existing_loggers': False, 'formatters': { 'standard': { 'format': standard_format }, 'simple': { 'format': simple_format }, }, 'filters': {}, # 过滤日志 'handlers': { #打印到终端的日志 'console': { 'level': 'DEBUG', 'class': 'logging.StreamHandler', # 打印到屏幕 'formatter': 'simple' }, #打印到文件的日志,收集info及以上的日志 'default': { 'level': 'DEBUG', 'class': 'logging.handlers.RotatingFileHandler', # 保存到文件 'formatter': 'standard', 'filename': logfile_path, # 日志文件 'maxBytes': 1024*1024*5, # 日志大小 5M 'backupCount': 5, 'encoding': 'utf-8', # 日志文件的编码,再也不用担心中文log乱码了 }, }, 'loggers': { #logging.getLogger(__name__)拿到的logger配置 '': { 'handlers': ['default', 'console'], # 这里把上面定义的两个handler都加上,即log数据既写入文件又打印到屏幕 'level': 'DEBUG', 'propagate': True, # 向上(更高level的logger)传递 }, # 当键不存在的情况下 默认都会使用该k:v配置 }, } # 使用日志字典配置 logging.config.dictConfig(LOGGING_DIC) # 自动加载字典中的配置 logger1 = logging.getLogger('asajdjdskaj') logger1.debug('好好的 不要浮躁 努力就有收获')
在项目的编写中使用logger需要对其路径进行配置,对其getlogger的名字可以随意修改,其返回值也应该是logger1对象,使得用户可以自由返回日志内容。
三。haslib模块
哈希lib模块是一个对文件加密的模块
1.md5算法:
import hashlib md1=hashlib.md5() md1.update(b'4') print(md1.hexdigest()) #输出结果>>>a87ff679a2f3e71d9181a67b7542122c
在上述代码中,引入了hashlib模块的md5算法,然后建立一个制造密文的对象,调用该对象使用update进明文加密,注意,update只接受bytes格式的数据。最后输出密文。
hashlib的加密是无法被解密的,因为这个算法是不可逆的,唯一的破解方法就是撞库,
撞库分为脱库和洗库,将各个字符串的哈希值存储到数据库中,在根据哈希值逆推原数据。
只要传入的内容相同,生成的密文一定相同,密文可以分多次传入:
import hashlib md1=hashlib.md5() md2=hashlib.md5() md1.update(b'4') md1.update(b'4') md1.update(b'4') md2.update(b'444') print(md1.hexdigest()) print(md2.hexdigest()) #输出结果>>>550a141f12de6341fba65b0ad0433500 #550a141f12de6341fba65b0ad0433500
不同的算法使用的方法是相同的。
生成的密文越长,算法越复杂,所消耗的时间就越多。
应用场景
1.密码的密文存储
2.检验文件是否相同
加盐:
在加密的时候,可以通过加盐处理对密文进行加工,是密文更加复杂,即使通过撞库获得了原密码,也不会知道真正的密码。
md1=hashlib.md5() md1.update('我是盐'.encode('utf-8')) md1.update('我是密码'.encode('utf-8')) print(md1.hexdigest())
比加盐更复杂的是动态加盐,就是对加的盐进行动态处理。
在实际应用中可以用函数对其封装,解密的时候再次调用函数进行对比。
四。openpyxl模块
openpyxl模块是为了操作excel文件而存在
在03版本之前,excel的后缀名是xls,而03以后的版本是xlsx。
openpyxl只支持03版本以后的,就是操作文件后缀为xlsx的文件。
openpyxl是第三方模块,所以需要在setting里面设置模块下载。
from openpyxl import Workbook wb = Workbook() # 先生成一个工作簿 wb1 = wb.create_sheet('index',0) # 创建一个表单页 后面可以通过数字控制位置 wb2 = wb.create_sheet('index1') wb1.title = 'login' # 后期可以通过表单页对象点title修改表单页名称
wb.save('test.xlsx')
首先建立一个工作铺,然后对工作簿进行操作就是对表进行操作。
使用create_sheet的方法建立表中的分表,也可以传入索引指定表所生成的位置。
当分表建立好之后可以使用.title方法对分表的名字进行修改。
最后使用save进行保存,这样就会生成该名字的表。
索引写入值:
wb1['A3'] = 666 wb1['A4'] = 444 wb1.cell(row=6,column=3,value=88888888) wb1['A5'] = '=sum(A3:A4)'
直接对分表中的单元格进行赋值。赋值也可以写入函数对其他单元格中的数据进行求和等操作。
使用cell方法输入行列和值也可以对单元格进行传值。
wb1.append(['username','age','hobby']) wb1.append(['jason',18,'study']) wb1.append(['tank',72,'吃生蚝']) wb1.append(['egon',84,'女教练']) wb1.append(['sean',23,'会所']) wb1.append(['nick',28,]) wb1.append(['nick','','秃头'])
使用append将一个列表加入分表。
读文件:
使用load_workbook对文件进行读操作:
from openpyxl import load_workbook # 读文件 wb = load_workbook('test.xlsx',read_only=True,data_only=True)
print(wb.sheetnames)
其输出的是一个对象,使用sheetname可以返回其终端分表单。
print(wb['login']['A3'].value) print(wb['login']['A4'].value) print(wb['login']['A5'].value)
使用这种方法可以取出单元格中的值
如果使用函数data_only将单元格中 的算数数据变成实际数据。需要在表格写完后,认为的改动文件后才能看到真实数据。也就是说存算法变成数据时存储的时算法。
读取表格中的数据,(大面积)
res = wb['login'] # print(res) ge1 = res.rows for i in ge1: for j in i: print(j.value)
五。深浅拷贝
以列表为例,在列表的拷贝中,有深与浅的区别:
import copy l = [1,2,[1,2]] l1 = l print(id(l),id(l1)) l1 = copy.copy(l) # 拷贝一份 ....... 浅拷贝 print(id(l),id(l1)) l[0] = 222 print(l,l1) l[2].append(666) print(l,l1) #输出结果>>>1939403613512 1939403613512 #1939403613512 1939403614792 #[222, 2, [1, 2]] [1, 2, [1, 2]] #[222, 2, [1, 2, 666]] [1, 2, [1, 2, 666]]
当拷贝完毕后,输出其id发现是一样的,而拷贝后的id是不一样的,当变动其中的不可变类型数据后,浅拷贝后的列表对应元素是不可变的,而变动其可变类型的数据会使得元素改变,原理如图:
其中的元素都是完全不变的拷贝下来,而深拷贝则是另外创建一个列表
import copy l = [1,2,[1,2]] l1 = copy.deepcopy(l) l[2].append(666) print(l,l1) #输出结果>>>[1, 2, [1, 2, 666]] [1, 2, [1, 2]]
深拷贝后改变原来的列表中的列表,拷贝后的文件就不会改变了:
print(wb.sheetnames)