Python开发——8.模块

一、模块

1.模块

（1）定义：一个.py文件就是一个模块

（2）原因：为了防止程序代码越来越长，对函数进行分组放到不同的文件夹里。

（3）优点：提高代码的可维护性；模块编写完毕可以被别人引用，也可以引用其他模块；可以避免变量名和函数名冲突

（4）模块种类：一共有三种①python标准库；②第三方模块；③应用程序自定义模块

2.模块导入方法

　　模块导入的本质：通过sys.path找到要导入的函数并执行该脚本，（1）方法会将变量名加载到变量空间，（2）会将变量名加载进来

（1）import 语句

import time
time.sleep(2)
print("OK")

（2）from...import语句

from module_test import cal
res = cal(1,2)
print(res

（3）from...import*语句

from module_test import *#不推荐这种方法，会有可能覆盖自己定义的函数（函数即变量）
res1 = cal(2,3)
res2 = sub(4,2)
print(res1,res2)

3.包

　　为了避免模块冲突，按目录来组织模块，这种目录就交包，包目录下面会有一个__init__文件，这是包和普通文件夹的区别

　　只要顶层包名称不冲突，包下面所有的模块都不会冲突

多层包引用

from test1.test2.module_test import cal
res = cal(1,2)
print(res)

4.测试代码

if __name__=="__main__":

　　两个特性：1.在执行代码中显示“__main__”；2.在调用模块中显示所在文件名称

（1）功能一：

　　在调试代码的时候加入，从另外一个.py文件调用该模块时，不会显示调试的内容

def cal(x,y):
  return (x+y)
def sub(x,y):
    return (x-y)
if __name__=="__main__":
    print ("ok")

（2）功能二：在执行代码中，防止自己的逻辑代码被别人调用

二、time模块

1.时间戳

import time
print(time.time())#时间戳 秒数，从1970年凌晨开始算，Unix的诞生时间

2.结构化时间

import time
print(time.localtime())#当地时间
print(time.gmtime())#UTC时

（1）将结构化时间转化为时间戳

import time
print(time.mktime(time.localtime()))

（2）将结构化时间转化为字符串时间

import time
print(time.strftime("%Y-%m-%d  %X",time.localtime()))

3.字符串时间

import time
t = time.localtime()
print(time.asctime(t))
print(time.ctime(1124324))

（1）将字符串时间转化为结构化时间

import time
print(time.strptime("2018-5-11 21:01:26","%Y-%m-%d %X"))

4.time.sleep()和time.clock()

（1）time.sleep()

　　time.sleep() 推迟指定的时间运行，单位为秒

（2）time.clock()

　　time.clock()函数以浮点数计算的秒数返回当前的CPU时间。用来衡量不同程序的耗时，比time.time()更有用。这个需要注意，在不同的系统上含义不同。在UNIX系统上，它返回的是"进程时间"，它是用秒表示的浮点数（时间戳）。而在WINDOWS中，第一次调用，返回的是进程运行的实际时间。而第二次之后的调用是自第一次调用以后到现在的运行时间。（实际上是以WIN32上QueryPerformanceCounter()为基础，它比毫秒表示更为精确）

import time
print(time.clock())
time.sleep(2)
print(time.clock())

5.datetime模块

（1）显示当前时间

import datetime
print(datetime.datetime.now())

三、random模块

1.random模块主要有以下几个功能

import random
print(random.random())#随机生成一个小于1的浮点数
print(random.randint(1,3))#随机生成一个整型，可以取到3
print(random.randrange(1,3))#随机生成一个整型，取不到3
print(random.choice([11,22,33,44]))#从列表中随机选取一个数
print(random.sample([11,22,33,44],2))#从列表中随机选取两个数
print(random.uniform(1,4))#生成指定范围内的浮点数
ret = [1,2,3,4,5]
random.shuffle(ret)#打乱顺序
print(ret)

2.生成验证码

import random
def v_code():
    ret = ""
    for i in range(4):
        num = random.randint(0,9)
        letter = chr(random.randint(65,90))
        s = str(random.choice([num,letter]))
        ret += s
    return ret
print(v_code())

四、os模块

1.os模块主要有以下功能

import os
os.getcwd()#获取当前的工作目录，即当前Python脚本的工作目录
os.chdir("D:\python_s3\day22")#改变当前脚本工作目录
os.curdir#返回当前目录：(".")
os.pardir#返回当前目录的父目录的字符串名:("..")
os.makedirs("test1/test2")#生成多层递归目录
os.removedirs("test2")#若目录为空，则删除，并递归到上一级目录，若为空也删除，以此类推
os.mkdir("test")#在当前工作目录生成单级目录
os.rmdir("test")#删除单级目录，若不为空，无法删除并报错
os.listdir()#列出指定目录下的所有文件和子目录，包括隐藏文件，以列表的方式打印
os.remove("test1.py")#删除文件
os.rename("test.py","test1.py")#重命名文件或目录
os.stat("D:\python_s3")#获取文件/目录信息
os.sep#输出操作系统特定的路径分隔符，win下为"\\",linux下为"/"
os.linesep#输出操作系统的行中止符，win下为"\t\n",linux下为"\n"
os.pathsep#输出用于分割文件路径的字符串，win下为"；",linux下为"："
os.name#输出字符串指示当前操作平台。win下为"nt",linux下为"posix"
os.system("bash command")#运行shell命令，直接显示
os.environ#获取系统环境变量
os.path.abspath(path="D:\python_s3\day22\os模块.py")#返回path规范化的绝对路径
os.path.split("D:\python_s3\day22\__init__.py")#将path分割成目录和文件名二元组返回，中文不行
os.path.dirname("D:\python_s3\day22\__init__.py")#目录
os.path.basename("D:\python_s3\day22\__init__.py")#文件名
os.path.exists("D:\python_s3\day22\__init__.py")#判断路径是否存在，存在返回True，不存在返回False
os.path.isabs("D:\python_s3\day22\__init__.py")#判断是否是绝对路径
os.path.isfile("D:\python_s3\day22\__init__.py")#判断是否是存在的文件
os.path.isdir("D:\python_s3\day22")#判断是否是存在的目录
os.path.join("D:/python_s3/","day22/","test1.py")#拼接路径返回
os.path.getatime("D:\python_s3\day22\test1.py")#返回文件或目录最后存取时间
os.path.getmtime("D:/python_s3/day22/test1.py")#返回文件或目录最后修改时间

五、sys模块

1.sys模块主要有以下功能

import sys
print(sys.argv)#输出当前路径
print(sys.version)#获取当前Python解释器版本信息
print(sys.path)#返回模块的搜索路径，初始化时使用Python环境变量的值
print(sys.platform)#打印操作系统平台名称
sys.exit(0)#退出系统，下面的命令不会执行

2.进度条功能

import sys,time
for i in range(100):
    sys.stdout.write("#")
    time.sleep(0.1)
    sys.stdout.flush()

六、json&pickle模块

1.json模块

　　序列化：把对象（变量）从内存中变成可存储或传输的过程叫序列化，序列化在Python中叫picking，在其他编程语言中也被称为serialization、marshalling、flattening等

　　反序列化：把变量内容从序列化的对象重读到内存中的过程叫反序列化，unpicking

（1）json功能和eval相似，但json应用范围更广泛

　　如果要在不同的编程语言之间传递对象，就要把对象序列化为标准格式，json是较好的序列化方法

a.eval：

f_read=open("hello","r")
data=f_read.read()
print(type(data))
data = eval(data)
print(data["name"])

b.json：

import json
dict={'name':"dazui"}
data=json.dumps(dict)
print(data)
i = 90
i = json.dumps(i)
print(i,type(i))
s = 'hello'
s = json.dumps(s)
print(s,type(s))
l = [11,22]
print(json.dumps(l))

（2）json.dumps和json.loads

　　如下代码所示：

import json
dic = {'name':'dazui'}
dic_str =json.dumps(dic)
f = open("new_hello","w")
f.write(dic_str)

f_read=open("new_hello","r")
data = json.loads(f_read.read())
print(data,type(data))
print(data["name"])

　　json.loads用来把json.dumps处理的字符串变为原来的值，相当于一个返的过程

（3）json.dump和json.load

　　与json.dumps和json.loads功能相似

json.dump(dic,f)
#相当于
dic_str =json.dumps(dic)
f.write(dic_str)

data=json.load(f)
#相当于
f_read=open("new_hello","r")
data = json.loads(f_read.read())

2.pickle模块

　　pickle模块与json模块类似，但在读取和写入的时候需要用b模式，同时，pickle只能用于Python中。

import pickle
dic = {'name':'dazui'}
f = open("new_hello","wb")#与json有区别，需要用b模式写入
dic_str =pickle.dumps(dic)
f.write(dic_str)

f_read=open("new_hello","rb")#与json有区别，需要用b模式读取
data = pickle.loads(f_read.read())
print(data,type(data))
print(data["name"])

七、shelve模块

　　shelve模块比pickle模块简单，只有一个open函数，返回类似字典的对象。

import shelve
f = shelve.open(r"NBA")
# f["team1"]={"name":"Lakers","Division":"Pacific"}
# f["team2"]={"name":"Warriors","Division":"Pacific"}
# f.close()
print(f.get("team1")["name"])
print(f.get("team1")["Division"])

八、xml模块

　　xml是实现不同语言或程序之间进行数据交换的协议，与json类似但不如json操作简单，由于出现时间较早，现在许多传统公司的系统接口还是用xml，如金融行业。

1.查看修改删除

import xml.etree.ElementTree as ET#将导入模块命名为ET

tree = ET.parse("xml_lesson")
root = tree.getroot()
print(root.tag)

遍历xml文档
for child in root:
    print(child.tag,child.attrib)
    for i in child:
        print(i.tag,i.text)

只遍历year节点
for node in root.iter("year"):
    print(node.tag,node.text)

修改
for node in root.iter("year"):
    new_year = int(node.text)+1
    node.text = str(new_year)
    node.set("updated","yes")

tree.write("xml_lesson")


删除
for country in root.findall("country"):
    rank = int(country.find("rank").text)
    if rank >50:
        root.remove(country)
tree.write("xml_lesson")

2.创建xml文档

#创建xml文档
import xml.etree.ElementTree as ET#将导入模块命名为ET
new_xml = ET.Element("namelist")
name = ET.SubElement(new_xml,"name",attrib={"enrolled":"yes"})
age = ET.SubElement(name,"age",attrib={"checked":"no"})
sex = ET.SubElement(name,"sex")
sex.text="33"
name2 = ET.SubElement(new_xml,"name",attrib={"enrolled":"no"})
age = ET.SubElement(name2,"age")
age.text = "19"

et = ET.ElementTree(new_xml)#生成文档对象
et.write("test.xml",encoding="utf-8",xml_declaration=True)

ET.dump(new_xml)#打印生成格式

九、re模块

1.re模块本质

　　正则表达式（RE）是一种小型的、高度专业化的编程语言，内嵌在Python中并通过re模块实现。正则表达式被编译成字节码，由c语言编写的匹配引擎执行

　　作用：主要用来模糊匹配

2.re模块下的方法

（1）re.findall()

import re
print(re.findall('zui','dazuizuigezuizui'))#用列表返回所有满足匹配条件的结果

（2）re.search()和re.match()

import re
print(re.search("zui",'dazuizuigezuizui'))#在字符串中搜索，匹配成功返回第一个匹配到的值，不成功返回None
print(re.match("dazui","dazuizuigezuizui"))#在字符串开头匹配，匹配成功需要.grup输出结果，不成功返回None

（3）.group()

import re
a = "123abc456"
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(0))   #123abc456,返回整体
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(1))   #123
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(2))   #abc
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(3))   #456

（4）re.split()

import re
print( re.split("[ab]","abcd"))#先按"a"分割得到""和"bcd"，再按"b"分割得到""和"cd"

（5）re.sub()和re.subn()

import re
print(re.sub("\d","dazui","adc1abc2",1))#按规则匹配到字符，将字符替换成指定字符串,"1"用来指定匹配个数
print(re.subn("\d","dazui","abc1abc2abc3"))#按规则匹配字符并替换，打印替换后的字符串和替换的个数

（6）re.compile

import re
obj = re.compile("\d{3}")#编译规则
ret = obj.search("abc123abc456")
print(ret.group())#123

（7）re.finditer()

import re
ret = re.finditer("\d","ab1c2bd3e4f5")
print(ret)
print(next(ret).group())#1
print(next(ret).group())#2
print(next(ret).group())#3
print(next(ret).group())#4

3.字符匹配（普通字符和元字符）

　　普通字符匹配：

import re
print(re.findall('dazui','dazuizuigezuizui'))

　　元字符：. ^ $ * + ? {} | \ [] ()

4.元字符

（1）. ^ $ * + ? {}

import re
#  .  ^  $  *  +  ?  {} 
print(re.findall("..zui","dazuizuizuizuige"))#["dazui","uizui"] "."代替一个字符
print(re.findall("^dazui","zuidazuizuizuige"))#[],"^"是否以XXX开头
print(re.findall("zuige$","zuidazuizuizuige"))#["zuige"],"$"是否以XXX结尾
print(re.findall("dazui*","dazuiiiizuizuizuigeiii"))#['dazuiiii'],"*"贪婪匹配（0，+∞）
print(re.findall("dazui+","dazuiiiizuizuizuigeiii"))#['dazuiiii'],"+"贪婪匹配（1，+∞）
print(re.findall("dazui?","dazuiiiizuizuizuigeiii"))#['dazui'],"?"贪婪匹配（0，1）
print(re.findall("dazui{2,3}","dazuiiiizuizuizuigeiii"))#['dazuiii'],"{}"贪婪匹配,自己定义范围

　　将 * + ? {} 贪婪匹配变为惰性匹配

print(re.findall("dazui*?","dazuiiiizuizuizuigeiii"))#['dazu'],贪婪匹配变为惰性匹配

（2）[]字符集

import re
print(re.findall("da[az]ui","dazuidaduidaaui"))#['dazui', 'daaui'],[az],a或z

#三个特殊字符
print(re.findall("da[a-z]ui","dazuidaduixiaozui"))#['dazui', 'dadui']，[a-z],a到z中任意一个
print(re.findall("da[^a-z]ui","da2uidaduixiaozui"))#['da2ui']，[^a-z],不能是a到z中任意一个
print(re.findall("da[\^a-z]ui","da^uida2zidazui"))#['da^ui', 'dazui']，[\^a-z]，^或a到z中的任意一个，\的作用是把有特殊意义的字符变得没特殊意义

（3）\转义字符

　　反斜杠后面跟元字符可以去除元字符的功能，如\^

　　反斜杠后面跟普通字符可以实现特殊功能，如\d

'''
\d 匹配任意十进制数，相当于类[0-9]
\D 匹配任意非数字字符，相当于类[^0-9]
\s 匹配任意空白字符，相当于类[\t\n\r\f\v]
\S 匹配任意非空白字符，相当于类[^\t\n\r\f\v]
\w 匹配任意字母数字字符下划线和汉字，相当于类[a-zA-Z0-9_]
\W 匹配任意非字母数字字符，相当于类[^a-zA-Z0-9_]
\b 匹配一个特殊字符边界，如空格、&、#等
'''
import re
print(re.findall("I\b","I am hehcouzi"))#[]
print(re.findall(r"I\b","I am hehcouzi"))#['I']


#python解释器也用\进行转义，了解，r代表row string
print(re.findall("c\l","abc\le"))#[]
print(re.findall("c\\l","abc\le"))#[]
print(re.findall("c\\\\l","abc\le"))#['c\\l']
print(re.findall(r"c\\l","abc\le"))#['c\\l']

print(re.findall("\bblow","blow"))#[]
print(re.findall(r"\bblow","blow"))#['blow']

（4）()分组

import re
print(re.findall("(ad)+","adad"))#['ad']
print(re.findall("(?:ad)+","adad"))#['adad'],去优先级

（5）|

import re
print(re.findall("a|b","abc"))#['a', 'b']

十、logging模块

1.简单应用

import logging

logging.debug("嘴嘴")
logging.info("嘴哥")
logging.warning("大嘴")
logging.error("克格莫")
logging.critical("深渊巨口")

　　默认情况下，logging模块将日志打印到标准输出中，且只显示WARNING及以上级别的日志

　　日志级别：CRITICAL>ERROR>WARNING>INFO>DEBUG

2.logging.basicConfig 灵活配置日志级别、日志格式、输出位置

import logging
logging.basicConfig(level=logging.DEBUG,
                    format="%(asctime)s %(filename)s[line:%(lineno)d] %(levelname)s %(message)s",
                    datefmt=" %a, %d %b %Y %H:%M:%s",
                    filename="D:\python_s3\day22\test.log",
                    filemode="w")
logging.debug("1")
logging.info("2")
logging.warning("3")
logging.error("4")
logging.critical("5")

　　在logging.basicConfig()函数中可通过参数来更改logging模块默认行为

　　filename：用指定的文件名创建FiledHandler，日志会被存储在指定的文件中

　　filemode：文件打开方式，在指定了filename时使用这个参数，默认值为“a”，还可以指定为“w”

　　format：指定handler使用的日志显示格式

　　datefmt：指定日期时间格式

　　level：设置rootlogger的日志级别

　　stream：用指定的stream创建StreamHandler。可以指定输出到sys.stder,sys.stout或者文件(f=open("test.log",w)).

　　format参数中可能用到的格式化串：

　　　　%(name)s 　　Logger的名字

　　　　%(levelno)s　　数字形式的日志级别

　　　　%(levelname)s　　文本形式的日志级别

　　　　%(pathname)s 　　调用日志输出函数的模块的完整路径名，可能没有

　　　　%(filename)s　　调用日志输出函数的模块的文件名

　　　　%(module)s　　调用日志输出函数的模块名

　　　　%(funcName)s　　调用日志输出函数的函数名

　　　　%(lineno)d　　调用日志输出函数的语句所在的代码行

　　　　%(created)f　　当前时间，用Unix标准的表示时间的浮点数表示

　　　　%(relativeCreated)d　　字Logger创建以来到输出日志信息时的毫秒数

　　　　%(asctime)s　　用字符串形式显示当前时间。默认格式是“年-月-日时：分：秒，毫秒”

　　　　%(thread)d　　线程ID，可能不存在

　　　　%(threadName)s　　线程名，可能不存在

　　　　%(process)d　　进程ID，可能不存在

　　　　%(message)s　　用户输出的消息

3.logger对象

（1）

import logging
def logger():
    logger = logging.getLogger()
    fh = logging.FileHandler("test1.log")#创建一个handler，用于写入日志文件
    ch = logging.StreamHandler()#再创建一个handler，用于输出到控制台
    fm = logging.Formatter("%(asctime)s %(name)s %(levelname)s %(message)s")
    fh.setFormatter(fm)
    ch.setFormatter(fm)

    logger.addHandler(fh)
    logger.addHandler(ch)
    logger.setLevel("DEBUG")
    return logger

logger=logger()
logging.debug("嘴嘴")
logging.info("嘴哥")
logging.warning("大嘴")
logging.error("克格莫")
logging.critical("深渊巨口")

　　logging库提供了多个组件：Logger、Handler、Filter、Formatter。Logger对象提供应用程序可直接使用的接口，Handler发送日志到适当的目的地，Filter提供了过滤日志信息的方法，Formatter指定日志显示格式。

　　Logger是一个树形层级结构，输出信息之前都要获得一个Logger（如果没有显示的获取，则自动创建并使用root Logger）

　　logger=logging.getLogger()，返回一个默认的Logger即root Logger，并应用默认的日志级别、Handler和Formatter设置。

（2）

#两个logger打印结果以后定义的为准（一切皆变量）
import logging
logger = logging.getLogger()
logger1 = logging.getLogger("mylogger")
logger2 = logging.getLogger("mylogger")#logger2和logger1s是同一个对象

fh = logging.FileHandler("test_new.log")  # 创建一个handler，用于写入日志文件
ch = logging.StreamHandler()  # 再创建一个handler，用于输出到控制台

logger1.addHandler(fh)
logger1.addHandler(ch)

logger2.addHandler(fh)
logger2.addHandler(ch)

logger1.setLevel(logging.DEBUG)
logger2.setLevel(logging.INFO)

logger1.debug("嘴嘴")
logger1.info("嘴哥")
logger1.warning("大嘴")
logger1.error("克格莫")
logger1.critical("深渊巨口")

logger2.debug("嘴嘴")
logger2.info("嘴哥")
logger2.warning("大嘴")
logger2.error("克格莫")
logger2.critical("深渊巨口")

　　logger1和logger2对应的是同一个Logger实例，只要logging.getLogger(name)中名称参数name相同则返回的Logger实例就是同一个，且仅有一个，即name与Logger实例一一对应。

（3）

#父辈如果有输出，子辈要多输出依次
import logging
logger = logging.getLogger()
logger1 = logging.getLogger("mylogger")

fh = logging.FileHandler("test_new.log")  # 创建一个handler，用于写入日志文件
ch = logging.StreamHandler()  # 再创建一个handler，用于输出到控制台

logger1.addHandler(fh)
logger1.addHandler(ch)

logger.addHandler(fh)
logger.addHandler(ch)

logger1.setLevel(logging.DEBUG)
logger.setLevel(logging.ERROR)

logger1.debug("嘴嘴")
logger1.info("嘴哥")
logger1.warning("大嘴")
logger1.error("克格莫")
logger1.critical("深渊巨口")

logger.debug("嘴嘴")
logger.info("嘴哥")
logger.warning("大嘴")
logger.error("克格莫")
logger.critical("深渊巨口")

　　通过logger = logging.getLogger()创建root logger，其余的创建的是子辈logger，父辈打印的时候照常，子辈在打印的时候会向上找父辈，如果父辈存在，子辈会多打印一次。

十二、configparser模块（配置文件的解析模块）

1.创建文档

import configparser
config = configparser.ConfigParser()  #config={}
#给空字典加键值对
config["DEFAULT"]={"ServerAliveInterval":"45",
                   "Compression":"yes",
                   "CompressionLevel":"9"}

config["bitbucket"]={}
config["bitbucket"]["User"]="hg"

config["topsecret.server.com"]={}
topsecret =config["topsecret.server.com"]
topsecret["Host Port"]="50022"
topsecret["ForwardX11"]="no"
#写入
with open("configtest","w") as f:
    config.write(f)

2.查看、增加和删除

import configparser
config = configparser.ConfigParser()  #config={}
#>>>>>>>>>>>>>>>查看
print(config.sections())#[]
config.read("configtest")
print(config.sections())#['bitbucket', 'topsecret.server.com']
print("topsecret.server.com"in config)#True
print(config["bitbucket"]["UsEr"])#hg,user不区分大小

for key in config['bitbucket']:#打印user serveraliveinterval compression compressionlevel
    print(key)
print(config.options("bitbucket"))#打印['user', 'serveraliveinterval', 'compression', 'compressionlevel']
print(config.items("bitbucket"))#打印[('serveraliveinterval', '45'), ('compression', 'yes'), ('compressionlevel', '9'), ('user', 'hg')]
print(config.get("bitbucket","compression"))#打印compression的值

#>>>>>>>>>>>>>增
config.add_section("Lakers")
config.set("Lakers","Kobe","0824")
# config.write(open("configtest","w"))

#>>>>>>>>>>>>删除
config.remove_section("topsecret.server.com")
config.remove_option("bitbucket","user")
config.write(open("configtest","w"))

十三、hashlib模块

　　hashlib模块主要用于加密的相关操作，在Python3.x版本中，替代了md5和sha模块，主要提供SHA1,SHA224,SHA256,SHA384,SHA512,MD5算法

加密算法存在缺陷，通过撞库可以反解，所以需要在加密算法中自定义key再来加密。

import hashlib
obj = hashlib.md5("hello".encode("utf-8"))
print(obj.hexdigest())#5d41402abc4b2a76b9719d911017c592
obj.update("你好".encode("utf-8"))
print(obj.hexdigest())#2cfe361166078c59730c075c966bfe91
obj=hashlib.md5("hello你好".encode("utf-8"))
print(obj.hexdigest())#2cfe361166078c59730c075c966bfe91

#加密
sha =hashlib.sha256("用来加密别人不知道".encode("utf-8"))
sha.update("hello".encode("utf-8"))
print(sha.hexdigest())#9f95aeca58b1d2c0bc36f2e73037c67d9022bceadcfa01a2b0b7724e631c7bf7

posted on 2018-05-11 21:57 hechengwei 阅读(181) 评论(0) 收藏举报

刷新页面返回顶部

hechengwei

导航

公告