Python开发——8.模块
一、模块
1.模块
(1)定义:一个.py文件就是一个模块
(2)原因:为了防止程序代码越来越长,对函数进行分组放到不同的文件夹里。
(3)优点:提高代码的可维护性;模块编写完毕可以被别人引用,也可以引用其他模块;可以避免变量名和函数名冲突
(4)模块种类:一共有三种①python标准库;②第三方模块;③应用程序自定义模块
2.模块导入方法
模块导入的本质:通过sys.path找到要导入的函数并执行该脚本,(1)方法会将变量名加载到变量空间,(2)会将变量名加载进来
(1)import 语句
import time
time.sleep(2)
print("OK")
(2)from...import语句
from module_test import cal
res = cal(1,2)
print(res
(3)from...import*语句
from module_test import *#不推荐这种方法,会有可能覆盖自己定义的函数(函数即变量)
res1 = cal(2,3)
res2 = sub(4,2)
print(res1,res2)
3.包
为了避免模块冲突,按目录来组织模块,这种目录就交包,包目录下面会有一个__init__文件,这是包和普通文件夹的区别
只要顶层包名称不冲突,包下面所有的模块都不会冲突
多层包引用
from test1.test2.module_test import cal
res = cal(1,2)
print(res)
4.测试代码
if __name__=="__main__":
两个特性:1.在执行代码中显示“__main__”;2.在调用模块中显示所在文件名称
(1)功能一:
在调试代码的时候加入,从另外一个.py文件调用该模块时,不会显示调试的内容
def cal(x,y):
return (x+y)
def sub(x,y):
return (x-y)
if __name__=="__main__":
print ("ok")
(2)功能二:在执行代码中,防止自己的逻辑代码被别人调用
二、time模块
1.时间戳
import time
print(time.time())#时间戳 秒数,从1970年凌晨开始算,Unix的诞生时间
2.结构化时间
import time
print(time.localtime())#当地时间
print(time.gmtime())#UTC时
(1)将结构化时间转化为时间戳
import time
print(time.mktime(time.localtime()))
(2)将结构化时间转化为字符串时间
import time
print(time.strftime("%Y-%m-%d %X",time.localtime()))
3.字符串时间
import time
t = time.localtime()
print(time.asctime(t))
print(time.ctime(1124324))
(1)将字符串时间转化为结构化时间
import time
print(time.strptime("2018-5-11 21:01:26","%Y-%m-%d %X"))
4.time.sleep()和time.clock()
(1)time.sleep()
time.sleep() 推迟指定的时间运行,单位为秒
(2)time.clock()
time.clock()函数以浮点数计算的秒数返回当前的CPU时间。用来衡量不同程序的耗时,比time.time()更有用。这个需要注意,在不同的系统上含义不同。在UNIX系统上,它返回的是"进程时间",它是用秒表示的浮点数(时间戳)。而在WINDOWS中,第一次调用,返回的是进程运行的实际时间。而第二次之后的调用是自第一次调用以后到现在的运行时间。(实际上是以WIN32上QueryPerformanceCounter()为基础,它比毫秒表示更为精确)
import time
print(time.clock())
time.sleep(2)
print(time.clock())
5.datetime模块
(1)显示当前时间
import datetime
print(datetime.datetime.now())
三、random模块
1.random模块主要有以下几个功能
import random
print(random.random())#随机生成一个小于1的浮点数
print(random.randint(1,3))#随机生成一个整型,可以取到3
print(random.randrange(1,3))#随机生成一个整型,取不到3
print(random.choice([11,22,33,44]))#从列表中随机选取一个数
print(random.sample([11,22,33,44],2))#从列表中随机选取两个数
print(random.uniform(1,4))#生成指定范围内的浮点数
ret = [1,2,3,4,5]
random.shuffle(ret)#打乱顺序
print(ret)
2.生成验证码
import random
def v_code():
ret = ""
for i in range(4):
num = random.randint(0,9)
letter = chr(random.randint(65,90))
s = str(random.choice([num,letter]))
ret += s
return ret
print(v_code())
四、os模块
1.os模块主要有以下功能
import os
os.getcwd()#获取当前的工作目录,即当前Python脚本的工作目录
os.chdir("D:\python_s3\day22")#改变当前脚本工作目录
os.curdir#返回当前目录:(".")
os.pardir#返回当前目录的父目录的字符串名:("..")
os.makedirs("test1/test2")#生成多层递归目录
os.removedirs("test2")#若目录为空,则删除,并递归到上一级目录,若为空也删除,以此类推
os.mkdir("test")#在当前工作目录生成单级目录
os.rmdir("test")#删除单级目录,若不为空,无法删除并报错
os.listdir()#列出指定目录下的所有文件和子目录,包括隐藏文件,以列表的方式打印
os.remove("test1.py")#删除文件
os.rename("test.py","test1.py")#重命名文件或目录
os.stat("D:\python_s3")#获取文件/目录信息
os.sep#输出操作系统特定的路径分隔符,win下为"\\",linux下为"/"
os.linesep#输出操作系统的行中止符,win下为"\t\n",linux下为"\n"
os.pathsep#输出用于分割文件路径的字符串,win下为";",linux下为":"
os.name#输出字符串指示当前操作平台。win下为"nt",linux下为"posix"
os.system("bash command")#运行shell命令,直接显示
os.environ#获取系统环境变量
os.path.abspath(path="D:\python_s3\day22\os模块.py")#返回path规范化的绝对路径
os.path.split("D:\python_s3\day22\__init__.py")#将path分割成目录和文件名二元组返回,中文不行
os.path.dirname("D:\python_s3\day22\__init__.py")#目录
os.path.basename("D:\python_s3\day22\__init__.py")#文件名
os.path.exists("D:\python_s3\day22\__init__.py")#判断路径是否存在,存在返回True,不存在返回False
os.path.isabs("D:\python_s3\day22\__init__.py")#判断是否是绝对路径
os.path.isfile("D:\python_s3\day22\__init__.py")#判断是否是存在的文件
os.path.isdir("D:\python_s3\day22")#判断是否是存在的目录
os.path.join("D:/python_s3/","day22/","test1.py")#拼接路径返回
os.path.getatime("D:\python_s3\day22\test1.py")#返回文件或目录最后存取时间
os.path.getmtime("D:/python_s3/day22/test1.py")#返回文件或目录最后修改时间
五、sys模块
1.sys模块主要有以下功能
import sys
print(sys.argv)#输出当前路径
print(sys.version)#获取当前Python解释器版本信息
print(sys.path)#返回模块的搜索路径,初始化时使用Python环境变量的值
print(sys.platform)#打印操作系统平台名称
sys.exit(0)#退出系统,下面的命令不会执行
2.进度条功能
import sys,time
for i in range(100):
sys.stdout.write("#")
time.sleep(0.1)
sys.stdout.flush()
六、json&pickle模块
1.json模块
序列化:把对象(变量)从内存中变成可存储或传输的过程叫序列化,序列化在Python中叫picking,在其他编程语言中也被称为serialization、marshalling、flattening等
反序列化:把变量内容从序列化的对象重读到内存中的过程叫反序列化,unpicking
(1)json功能和eval相似,但json应用范围更广泛
如果要在不同的编程语言之间传递对象,就要把对象序列化为标准格式,json是较好的序列化方法
a.eval:
f_read=open("hello","r")
data=f_read.read()
print(type(data))
data = eval(data)
print(data["name"])
b.json:
import json
dict={'name':"dazui"}
data=json.dumps(dict)
print(data)
i = 90
i = json.dumps(i)
print(i,type(i))
s = 'hello'
s = json.dumps(s)
print(s,type(s))
l = [11,22]
print(json.dumps(l))
(2)json.dumps和json.loads
如下代码所示:
import json
dic = {'name':'dazui'}
dic_str =json.dumps(dic)
f = open("new_hello","w")
f.write(dic_str)
f_read=open("new_hello","r")
data = json.loads(f_read.read())
print(data,type(data))
print(data["name"])
json.loads用来把json.dumps处理的字符串变为原来的值,相当于一个返的过程
(3)json.dump和json.load
与json.dumps和json.loads功能相似
json.dump(dic,f)
#相当于
dic_str =json.dumps(dic)
f.write(dic_str)
data=json.load(f)
#相当于
f_read=open("new_hello","r")
data = json.loads(f_read.read())
2.pickle模块
pickle模块与json模块类似,但在读取和写入的时候需要用b模式,同时,pickle只能用于Python中。
import pickle
dic = {'name':'dazui'}
f = open("new_hello","wb")#与json有区别,需要用b模式写入
dic_str =pickle.dumps(dic)
f.write(dic_str)
f_read=open("new_hello","rb")#与json有区别,需要用b模式读取
data = pickle.loads(f_read.read())
print(data,type(data))
print(data["name"])
七、shelve模块
shelve模块比pickle模块简单,只有一个open函数,返回类似字典的对象。
import shelve
f = shelve.open(r"NBA")
# f["team1"]={"name":"Lakers","Division":"Pacific"}
# f["team2"]={"name":"Warriors","Division":"Pacific"}
# f.close()
print(f.get("team1")["name"])
print(f.get("team1")["Division"])
八、xml模块
xml是实现不同语言或程序之间进行数据交换的协议,与json类似但不如json操作简单,由于出现时间较早,现在许多传统公司的系统接口还是用xml,如金融行业。
1.查看修改删除
import xml.etree.ElementTree as ET#将导入模块命名为ET
tree = ET.parse("xml_lesson")
root = tree.getroot()
print(root.tag)
遍历xml文档
for child in root:
print(child.tag,child.attrib)
for i in child:
print(i.tag,i.text)
只遍历year节点
for node in root.iter("year"):
print(node.tag,node.text)
修改
for node in root.iter("year"):
new_year = int(node.text)+1
node.text = str(new_year)
node.set("updated","yes")
tree.write("xml_lesson")
删除
for country in root.findall("country"):
rank = int(country.find("rank").text)
if rank >50:
root.remove(country)
tree.write("xml_lesson")
2.创建xml文档
#创建xml文档
import xml.etree.ElementTree as ET#将导入模块命名为ET
new_xml = ET.Element("namelist")
name = ET.SubElement(new_xml,"name",attrib={"enrolled":"yes"})
age = ET.SubElement(name,"age",attrib={"checked":"no"})
sex = ET.SubElement(name,"sex")
sex.text="33"
name2 = ET.SubElement(new_xml,"name",attrib={"enrolled":"no"})
age = ET.SubElement(name2,"age")
age.text = "19"
et = ET.ElementTree(new_xml)#生成文档对象
et.write("test.xml",encoding="utf-8",xml_declaration=True)
ET.dump(new_xml)#打印生成格式
九、re模块
1.re模块本质
正则表达式(RE)是一种小型的、高度专业化的编程语言,内嵌在Python中并通过re模块实现。正则表达式被编译成字节码,由c语言编写的匹配引擎执行
作用:主要用来模糊匹配
2.re模块下的方法
(1)re.findall()
import re
print(re.findall('zui','dazuizuigezuizui'))#用列表返回所有满足匹配条件的结果
(2)re.search()和re.match()
import re
print(re.search("zui",'dazuizuigezuizui'))#在字符串中搜索,匹配成功返回第一个匹配到的值,不成功返回None
print(re.match("dazui","dazuizuigezuizui"))#在字符串开头匹配,匹配成功需要.grup输出结果,不成功返回None
(3).group()
import re
a = "123abc456"
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(0)) #123abc456,返回整体
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(1)) #123
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(2)) #abc
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(3)) #456
(4)re.split()
import re
print( re.split("[ab]","abcd"))#先按"a"分割得到""和"bcd",再按"b"分割得到""和"cd"
(5)re.sub()和re.subn()
import re
print(re.sub("\d","dazui","adc1abc2",1))#按规则匹配到字符,将字符替换成指定字符串,"1"用来指定匹配个数
print(re.subn("\d","dazui","abc1abc2abc3"))#按规则匹配字符并替换,打印替换后的字符串和替换的个数
(6)re.compile
import re
obj = re.compile("\d{3}")#编译规则
ret = obj.search("abc123abc456")
print(ret.group())#123
(7)re.finditer()
import re
ret = re.finditer("\d","ab1c2bd3e4f5")
print(ret)
print(next(ret).group())#1
print(next(ret).group())#2
print(next(ret).group())#3
print(next(ret).group())#4
3.字符匹配(普通字符和元字符)
普通字符匹配:
import re
print(re.findall('dazui','dazuizuigezuizui'))
元字符:. ^ $ * + ? {} | \ [] ()
4.元字符
(1). ^ $ * + ? {}
import re
# . ^ $ * + ? {}
print(re.findall("..zui","dazuizuizuizuige"))#["dazui","uizui"] "."代替一个字符
print(re.findall("^dazui","zuidazuizuizuige"))#[],"^"是否以XXX开头
print(re.findall("zuige$","zuidazuizuizuige"))#["zuige"],"$"是否以XXX结尾
print(re.findall("dazui*","dazuiiiizuizuizuigeiii"))#['dazuiiii'],"*"贪婪匹配(0,+∞)
print(re.findall("dazui+","dazuiiiizuizuizuigeiii"))#['dazuiiii'],"+"贪婪匹配(1,+∞)
print(re.findall("dazui?","dazuiiiizuizuizuigeiii"))#['dazui'],"?"贪婪匹配(0,1)
print(re.findall("dazui{2,3}","dazuiiiizuizuizuigeiii"))#['dazuiii'],"{}"贪婪匹配,自己定义范围
将 * + ? {} 贪婪匹配变为惰性匹配
print(re.findall("dazui*?","dazuiiiizuizuizuigeiii"))#['dazu'],贪婪匹配变为惰性匹配
(2)[]字符集
import re
print(re.findall("da[az]ui","dazuidaduidaaui"))#['dazui', 'daaui'],[az],a或z
#三个特殊字符
print(re.findall("da[a-z]ui","dazuidaduixiaozui"))#['dazui', 'dadui'],[a-z],a到z中任意一个
print(re.findall("da[^a-z]ui","da2uidaduixiaozui"))#['da2ui'],[^a-z],不能是a到z中任意一个
print(re.findall("da[\^a-z]ui","da^uida2zidazui"))#['da^ui', 'dazui'],[\^a-z],^或a到z中的任意一个,\的作用是把有特殊意义的字符变得没特殊意义
(3)\转义字符
反斜杠后面跟元字符可以去除元字符的功能,如\^
反斜杠后面跟普通字符可以实现特殊功能,如\d
'''
\d 匹配任意十进制数,相当于类[0-9]
\D 匹配任意非数字字符,相当于类[^0-9]
\s 匹配任意空白字符,相当于类[\t\n\r\f\v]
\S 匹配任意非空白字符,相当于类[^\t\n\r\f\v]
\w 匹配任意字母数字字符下划线和汉字,相当于类[a-zA-Z0-9_]
\W 匹配任意非字母数字字符,相当于类[^a-zA-Z0-9_]
\b 匹配一个特殊字符边界,如空格、&、#等
'''
import re
print(re.findall("I\b","I am hehcouzi"))#[]
print(re.findall(r"I\b","I am hehcouzi"))#['I']
#python解释器也用\进行转义,了解,r代表row string
print(re.findall("c\l","abc\le"))#[]
print(re.findall("c\\l","abc\le"))#[]
print(re.findall("c\\\\l","abc\le"))#['c\\l']
print(re.findall(r"c\\l","abc\le"))#['c\\l']
print(re.findall("\bblow","blow"))#[]
print(re.findall(r"\bblow","blow"))#['blow']
(4)()分组
import re
print(re.findall("(ad)+","adad"))#['ad']
print(re.findall("(?:ad)+","adad"))#['adad'],去优先级
(5)|
import re
print(re.findall("a|b","abc"))#['a', 'b']
十、logging模块
1.简单应用
import logging
logging.debug("嘴嘴")
logging.info("嘴哥")
logging.warning("大嘴")
logging.error("克格莫")
logging.critical("深渊巨口")
默认情况下,logging模块将日志打印到标准输出中,且只显示WARNING及以上级别的日志
日志级别:CRITICAL>ERROR>WARNING>INFO>DEBUG
2.logging.basicConfig 灵活配置日志级别、日志格式、输出位置
import logging
logging.basicConfig(level=logging.DEBUG,
format="%(asctime)s %(filename)s[line:%(lineno)d] %(levelname)s %(message)s",
datefmt=" %a, %d %b %Y %H:%M:%s",
filename="D:\python_s3\day22\test.log",
filemode="w")
logging.debug("1")
logging.info("2")
logging.warning("3")
logging.error("4")
logging.critical("5")
在logging.basicConfig()函数中可通过参数来更改logging模块默认行为
filename:用指定的文件名创建FiledHandler,日志会被存储在指定的文件中
filemode:文件打开方式,在指定了filename时使用这个参数,默认值为“a”,还可以指定为“w”
format:指定handler使用的日志显示格式
datefmt:指定日期时间格式
level:设置rootlogger的日志级别
stream:用指定的stream创建StreamHandler。可以指定输出到sys.stder,sys.stout或者文件(f=open("test.log",w)).
format参数中可能用到的格式化串:
%(name)s Logger的名字
%(levelno)s 数字形式的日志级别
%(levelname)s 文本形式的日志级别
%(pathname)s 调用日志输出函数的模块的完整路径名,可能没有
%(filename)s 调用日志输出函数的模块的文件名
%(module)s 调用日志输出函数的模块名
%(funcName)s 调用日志输出函数的函数名
%(lineno)d 调用日志输出函数的语句所在的代码行
%(created)f 当前时间,用Unix标准的表示时间的浮点数表示
%(relativeCreated)d 字Logger创建以来到输出日志信息时的毫秒数
%(asctime)s 用字符串形式显示当前时间。默认格式是“年-月-日 时:分:秒,毫秒”
%(thread)d 线程ID,可能不存在
%(threadName)s 线程名,可能不存在
%(process)d 进程ID,可能不存在
%(message)s 用户输出的消息
3.logger对象
(1)
import logging
def logger():
logger = logging.getLogger()
fh = logging.FileHandler("test1.log")#创建一个handler,用于写入日志文件
ch = logging.StreamHandler()#再创建一个handler,用于输出到控制台
fm = logging.Formatter("%(asctime)s %(name)s %(levelname)s %(message)s")
fh.setFormatter(fm)
ch.setFormatter(fm)
logger.addHandler(fh)
logger.addHandler(ch)
logger.setLevel("DEBUG")
return logger
logger=logger()
logging.debug("嘴嘴")
logging.info("嘴哥")
logging.warning("大嘴")
logging.error("克格莫")
logging.critical("深渊巨口")
logging库提供了多个组件:Logger、Handler、Filter、Formatter。Logger对象提供应用程序可直接使用的接口,Handler发送日志到适当的目的地,Filter提供了过滤日志信息的方法,Formatter指定日志显示格式。
Logger是一个树形层级结构,输出信息之前都要获得一个Logger(如果没有显示的获取,则自动创建并使用root Logger)
logger=logging.getLogger(),返回一个默认的Logger即root Logger,并应用默认的日志级别、Handler和Formatter设置。
(2)
#两个logger打印结果以后定义的为准(一切皆变量)
import logging
logger = logging.getLogger()
logger1 = logging.getLogger("mylogger")
logger2 = logging.getLogger("mylogger")#logger2和logger1s是同一个对象
fh = logging.FileHandler("test_new.log") # 创建一个handler,用于写入日志文件
ch = logging.StreamHandler() # 再创建一个handler,用于输出到控制台
logger1.addHandler(fh)
logger1.addHandler(ch)
logger2.addHandler(fh)
logger2.addHandler(ch)
logger1.setLevel(logging.DEBUG)
logger2.setLevel(logging.INFO)
logger1.debug("嘴嘴")
logger1.info("嘴哥")
logger1.warning("大嘴")
logger1.error("克格莫")
logger1.critical("深渊巨口")
logger2.debug("嘴嘴")
logger2.info("嘴哥")
logger2.warning("大嘴")
logger2.error("克格莫")
logger2.critical("深渊巨口")
logger1和logger2对应的是同一个Logger实例,只要logging.getLogger(name)中名称参数name相同则返回的Logger实例就是同一个,且仅有一个,即name与Logger实例一一对应。
(3)
#父辈如果有输出,子辈要多输出依次
import logging
logger = logging.getLogger()
logger1 = logging.getLogger("mylogger")
fh = logging.FileHandler("test_new.log") # 创建一个handler,用于写入日志文件
ch = logging.StreamHandler() # 再创建一个handler,用于输出到控制台
logger1.addHandler(fh)
logger1.addHandler(ch)
logger.addHandler(fh)
logger.addHandler(ch)
logger1.setLevel(logging.DEBUG)
logger.setLevel(logging.ERROR)
logger1.debug("嘴嘴")
logger1.info("嘴哥")
logger1.warning("大嘴")
logger1.error("克格莫")
logger1.critical("深渊巨口")
logger.debug("嘴嘴")
logger.info("嘴哥")
logger.warning("大嘴")
logger.error("克格莫")
logger.critical("深渊巨口")
通过logger = logging.getLogger()创建root logger,其余的创建的是子辈logger,父辈打印的时候照常,子辈在打印的时候会向上找父辈,如果父辈存在,子辈会多打印一次。
十二、configparser模块(配置文件的解析模块)
1.创建文档
import configparser
config = configparser.ConfigParser() #config={}
#给空字典加键值对
config["DEFAULT"]={"ServerAliveInterval":"45",
"Compression":"yes",
"CompressionLevel":"9"}
config["bitbucket"]={}
config["bitbucket"]["User"]="hg"
config["topsecret.server.com"]={}
topsecret =config["topsecret.server.com"]
topsecret["Host Port"]="50022"
topsecret["ForwardX11"]="no"
#写入
with open("configtest","w") as f:
config.write(f)
2.查看、增加和删除
import configparser
config = configparser.ConfigParser() #config={}
#>>>>>>>>>>>>>>>查看
print(config.sections())#[]
config.read("configtest")
print(config.sections())#['bitbucket', 'topsecret.server.com']
print("topsecret.server.com"in config)#True
print(config["bitbucket"]["UsEr"])#hg,user不区分大小
for key in config['bitbucket']:#打印user serveraliveinterval compression compressionlevel
print(key)
print(config.options("bitbucket"))#打印['user', 'serveraliveinterval', 'compression', 'compressionlevel']
print(config.items("bitbucket"))#打印[('serveraliveinterval', '45'), ('compression', 'yes'), ('compressionlevel', '9'), ('user', 'hg')]
print(config.get("bitbucket","compression"))#打印compression的值
#>>>>>>>>>>>>>增
config.add_section("Lakers")
config.set("Lakers","Kobe","0824")
# config.write(open("configtest","w"))
#>>>>>>>>>>>>删除
config.remove_section("topsecret.server.com")
config.remove_option("bitbucket","user")
config.write(open("configtest","w"))
十三、hashlib模块
hashlib模块主要用于加密的相关操作,在Python3.x版本中,替代了md5和sha模块,主要提供SHA1,SHA224,SHA256,SHA384,SHA512,MD5算法
加密算法存在缺陷,通过撞库可以反解,所以需要在加密算法中自定义key再来加密。
import hashlib
obj = hashlib.md5("hello".encode("utf-8"))
print(obj.hexdigest())#5d41402abc4b2a76b9719d911017c592
obj.update("你好".encode("utf-8"))
print(obj.hexdigest())#2cfe361166078c59730c075c966bfe91
obj=hashlib.md5("hello你好".encode("utf-8"))
print(obj.hexdigest())#2cfe361166078c59730c075c966bfe91
#加密
sha =hashlib.sha256("用来加密别人不知道".encode("utf-8"))
sha.update("hello".encode("utf-8"))
print(sha.hexdigest())#9f95aeca58b1d2c0bc36f2e73037c67d9022bceadcfa01a2b0b7724e631c7bf7
posted on 2018-05-11 21:57 hechengwei 阅读(165) 评论(0) 编辑 收藏 举报