Python基础(十)-模块
模块初识
一般把不同功能代码放到不同py文件,一个py文件就是一个模块
三种模块库:
1、Python标准库
2、第三方库
3、自定义库
导入模块:import 库名 (Python解释器只认识执行文件的路径(sys.path),导入自定义库时也只会从执行文件的路径开始找)
import sys print(sys.path) 结果: ['E:\\PyCharm\\Personal_practice\\cmdb', 'E:\\PyCharm\\Personal_practice\\cmdb', 'D:\\Program Files (x86)\\python\\python35\\python35.zip', 'D:\\Program Files (x86)\\python\\python35\\DLLs', 'D:\\Program Files (x86)\\python\\python35\\lib', 'D:\\Program Files (x86)\\python\\python35', 'D:\\Program Files (x86)\\python\\python35\\lib\\site-packages']
导入后的两个效果:
1、先执行模块所有代码 2、引入变量名
引入多个模块:import a,b,c
导入模块并重命名:from project.app01 import views as v
在调用模块下方法时,不建议 from a import * (全部引入)这么写可能会与自己当前定义的函数冲突
包:
用来组织模块,避免模块名重复产生冲突(文件夹中包含__init.py__文件)
导入模块时,解释器解释该py文件
当导入包(文件夹)时,解释器解释__init__.py文件
模块导入过程详解
在Python中使用import语句导入模块时,python通过三个步骤来完成这个行为。 1:在python模块加载路径中查找相应的模块文件 2:将模块文件编译成中间代码 3:执行模块文件中的代码 在python中模块的导入动作只发生一次。也就是说当一个模块在一个文件中被导入过一次以后,当另外的文件继续需要导入这个模块时,python首先会在sys.modules这个变量中查出是否已经
导入过这个模块,如果已经导入过则上面三个步骤不会执行,直接引用之前导入的内存中的内容。 在步骤2中,python首先会查找对应模块的.pyc文件,看该文件的最后修改时间是否比对应的.py文件的走后修改时间早,如果遭遇.py文件的最后修改时间,则重新编译模块并重新生成
字节码文件。注意,一个python程序的顶层文件不会生成.pyc文件。
当python完成步骤2以后会执行python文件中的语句,以生成对应的对象属性,比如def语句生成该模块的一个函数属性等。因为这个特性,假如模块中有一个print语句 ,
那么, 当该模块被第一次加载的时候,该输出语句就会将内容输出,但是由于模块只能被import一次,所以,当模块第二次被加载的时候,上面这三个步骤都不会被执行,
那么,这个输出不会再次出现。
多层包调用:
假如引入模块a.py在执行文件b同级目录c下里,在b中引入模块a:from c import a
假如引入模块a.py在执行文件b同级目录c/d下里,在b中引入模块a: from c.d import a
调用a下cal方法:a.cal() 或者 from c.d.a import cal cal()
__name__使用:
if __name__=='__main__' 在执行文件才成立
1.用于调用文件,测试模块代码(返回是文件名)
2.用于执行文件,强调不可调用
常用模块介绍
1、time模块
1 import time 2 print(time.time()) #时间戳-计算 3 print(time.localtime(time.time())) #结构化时间-显示 struct_time 4 print(time.gmtime()) #0时区结构化时间 5 print(time.mktime(time.localtime())) #结构化时间转化成时间戳 6 print(time.strftime('%Y-%m-%d %X',time.localtime())) #结构化时间转化成字符串时间(格式化时间format) 7 print(time.strptime('2016-12-12 18:22:56','%Y-%m-%d %X')) # format时间转化成结构化时间 8 9 print(time.ctime()) 10 print(time.ctime(1423441244)) #将时间戳直接转化成字符串时间固定格式(%a %b %d %H:%M:%S %Y) 11 12 print(time.asctime()) #等同下条 13 print(time.strftime('%a %b %d %H:%M:%S %Y',time.localtime())) #将结构化时间转化成字符串时间格式同上 14 15 #执行结果 16 1481596470.6987557 17 time.struct_time(tm_year=2016, tm_mon=12, tm_mday=13, tm_hour=10, tm_min=34, tm_sec=30, tm_wday=1, tm_yday=348, tm_isdst=0) 18 time.struct_time(tm_year=2016, tm_mon=12, tm_mday=13, tm_hour=2, tm_min=34, tm_sec=30, tm_wday=1, tm_yday=348, tm_isdst=0) 19 1481596470.0 20 2016-12-13 10:34:30 21 time.struct_time(tm_year=2016, tm_mon=12, tm_mday=12, tm_hour=18, tm_min=22, tm_sec=56, tm_wday=0, tm_yday=347, tm_isdst=-1) 22 Tue Dec 13 10:34:30 2016 23 Mon Feb 9 08:20:44 2015 24 Tue Dec 13 10:34:30 2016 25 Tue Dec 13 10:34:30 2016
两张图搞定time模块之间关系:
2、random模块
1 import random 2 3 print(random.random()) #返回固定取值范围0到1之间的随机浮点数 4 print(random.uniform(1,4)) #随机返回可定义取值范围1到4之间的浮点数 5 6 print(random.randint(1,4)) #两个值[1,4]随机返回定义取值范围内的一个整数 7 print(random.randrange(1,4)) #[1,4)和range一样 同上 8 9 print(random.choice([1,2,3,[1],'123'])) #随机返回一个值 10 print(random.sample([1,2,3,[1],'123'],3)) #随机返回定义的几个值 11 12 f=[1,2,'3'] 13 random.shuffle(f) #返回打乱顺序的列表 14 print(f) 15 16 ###执行结果 17 0.2171299686228637 18 3.7457633609923873 19 2 20 1 21 2 22 ['123', 1, 3] 23 ['3', 2, 1]
生成验证码:
1 import random 2 def v_code(): 3 code='' 4 for i in range(5): 5 num=random.randint(0,9) 6 alf=chr(random.randint(65,90)) 7 add=random.choice([num,alf]) 8 code+=str(add) 9 return code 10 print(v_code())
3、os模块
os.getcwd() #获取当前工作目录,即当前python脚本工作的目录路径 os.chdir("dirname") #改变当前脚本工作目录;相当于shell下cd os.curdir #返回当前目录: ('.') os.pardir #获取当前目录的父目录字符串名:('..') os.makedirs('dirname1/dirname2') #可生成多层递归目录 os.removedirs('dirname1') #若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推 os.mkdir('dirname') #生成单级目录;相当于shell中mkdir dirname os.rmdir('dirname') #删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname os.listdir('dirname') #列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印 os.remove() #删除一个文件 os.rename("oldname","newname") #重命名文件/目录 os.stat('path/filename') #获取文件/目录信息 os.sep #输出操作系统特定的路径分隔符,win下为"\\",Linux下为"/" os.linesep #输出当前平台使用的行终止符,win下为"\t\n",Linux下为"\n" os.pathsep #输出用于分割文件路径的字符串 win下为;,Linux下为: os.name #输出字符串指示当前使用平台。win->'nt'; Linux->'posix' os.system("bash command") #运行shell命令,直接显示 os.environ #获取系统环境变量 os.path.abspath(path) #返回path规范化的绝对路径 os.path.split(path) #将path分割成目录和文件名二元组返回 os.path.dirname(path) #返回path的目录。其实就是os.path.split(path)的第一个元素 os.path.basename(path) #返回path最后的文件名。如何path以/或\结尾,那么就会返回空值。即os.path.split(path)的第二个元素 os.path.exists(path) #如果path存在,返回True;如果path不存在,返回False os.path.isabs(path) #如果path是绝对路径,返回True os.path.isfile(path) #如果path是一个存在的文件,返回True。否则返回False os.path.isdir(path) #如果path是一个存在的目录,则返回True。否则返回False os.path.join(path1[, path2[, ...]]) #将多个路径组合后返回,第一个绝对路径之前的参数将被忽略 os.path.getatime(path) #返回path所指向的文件或者目录的最后存取时间 os.path.getmtime(path) #返回path所指向的文件或者目录的最后修改时间
4、sys模块
sys.argv 命令行参数List,第一个元素是程序本身路径
sys.exit(n) 退出程序,正常退出时exit(0)
sys.version 获取Python解释程序的版本信息
sys.maxint 最大的Int值
sys.path 返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
sys.platform 返回操作系统平台名称
#进度条显示 import sys import time for i in range(100): sys.stdout.write('#') time.sleep(0.1) sys.stdout.flush()
5、re模块
正则表达式用来对字符串进行模糊匹配(功能比字符串方法强大很多,我懂的)
元字符:
1 . 通配符 可以替代所有字符除了换行符\n 2 ^ 匹配开头 3 $ 匹配结束 4 5 6 * 匹配0到无穷次 7 + 匹配1到无穷次 8 ? 匹配0到1次 9 {} 自定义匹配次数 10 11 [] 字符集 只认识三种特殊字符: -(取值范围) ^(非) \(转移符),其他均为普通字符 12 | 表示或 管道两侧整体作为元素 13 () 分组符 14 \ 转移符
1 \d 匹配任何十进制数;它相当于类 [0-9]。 2 \D 匹配任何非数字字符;它相当于类 [^0-9]。 3 \s 匹配任何空白字符;它相当于类 [ \t\n\r\f\v]。 4 \S 匹配任何非空白字符;它相当于类 [^ \t\n\r\f\v]。 5 \w 匹配任何字母数字字符;它相当于类 [a-zA-Z0-9_]。 6 \W 匹配任何非字母数字字符;它相当于类 [^a-zA-Z0-9_] 7 \b 匹配一个特殊字符边界,比如空格 ,&,#等
###事例### print(re.findall('abc*','ab')) print(re.findall('abc*','abccccabdd')) print(re.findall('abc+','ababccc')) print(re.findall('^abc','abcabccc')) print(re.findall('^abcd','abcabccc')) print(re.findall('abc?','ababcccc')) print(re.findall('abc{3}','abccabcccccc')) print(re.findall('[a-c]','ab9999cwzAA')) #['a', 'b', 'c'] print(re.findall('[a-c]+','ab9999cwzAA')) #['ab', 'c'] print(re.findall('[^0-9]+','abc99cdd11cc')) #['abc', 'cdd', 'cc'] print(re.findall('[a\\\\c]+','a\cccc')) #python解释器 re模块 都有转义 ['a\\cccc'] print(re.findall(r'[a\\c]+','a\cccc')) #['a\\cccc'] print(re.findall('a|bc','babcbabccc')) #['a', 'bc', 'a', 'bc'] print(re.findall(r'I\b','I am I&nnnnn')) print(re.findall('a(bc)+','abcabcbccc')) #显示(bc)其实匹配的是a(bc)+ print(re.findall('a(?:bc)+','abcabcbccc')) # ?: 去除分组优先级 正常输出匹配['abc','abcbc'] print(re.findall('(?:abc)+','abcabccccadc')) ret=re.search('(?P<id>\d{2})/(?P<name>\w{3})','23/com') print(ret.group()) #23/com print(ret.group('id')) #23 print(ret.group('name')) #com
* + ? {}都是贪婪匹配,尽可能多的匹配,加上?就变成惰性匹配
print(re.findall('abc*?','abccccc') #返回['ab']
re模块常用方法:
1 re.findall('ab','abcabc') #列表返回所有匹配字符串['ab','ab'] 2 3 print(re.search('abc','abcabcabc').group()) #匹配第一个立即返回一个匹配对象,没匹配到返回None 4 <_sre.SRE_Match object; span=(0, 3), match='abc'> 5 通过group()方法取值 6 7 re.match() #相当于re.search() 但是只匹配开头 8 9 ret=re.split('[ab]','abcd') #先按'a'分割得到''和'bcd',在对''和'bcd'分别按'b'分割 10 print(ret)#['', '', 'cd'] 11 12 print(re.sub('\d','A','123abc3d')) #AAAabcAd 默认替换所有 13 print(re.sub('\d','A','123abc3d',2)) #AA3abc3d 指定替换个数 14 print(re.subn('\d','A','123abc3d')) #('AAAabcAd', 4) 15 print(re.subn('\d','A','123abc3d',2))#('AA3abc3d', 2) 只是返回值不同
6、hashlib
用于加密相关的操作,代替了md5模块和sha模块,主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ,MD5 算法
import hashlib # ######## md5 ######## 不能反解 hash = hashlib.md5() # help(hash.update) hash.update(bytes('admin', encoding='utf-8')) print(hash.hexdigest()) '21232f297a57a5a743894a0e4a801fc3' print(hash.digest()) b'!#/)zW\xa5\xa7C\x89J\x0eJ\x80\x1f\xc3' ######## sha1 ######## hash = hashlib.sha1() hash.update(bytes('admin', encoding='utf-8')) print(hash.hexdigest()) # ######## sha256 ######## hash = hashlib.sha256() hash.update(bytes('admin', encoding='utf-8')) print(hash.hexdigest()) # ######## sha384 ######## hash = hashlib.sha384() hash.update(bytes('admin', encoding='utf-8')) print(hash.hexdigest()) # ######## sha512 ######## hash = hashlib.sha512() hash.update(bytes('admin', encoding='utf-8')) print(hash.hexdigest())
以上加密算法虽然依然非常厉害,但时候存在缺陷,即:通过撞库可以反解。所以,有必要对加密算法中添加自定义key再来做加密。
1 import hashlib 2 3 # ######## md5 ######## 4 5 hash = hashlib.md5(bytes('898oaFs09f',encoding="utf-8")) 6 hash.update(bytes('admin',encoding="utf-8")) 7 print(hash.hexdigest())
python内置还有一个 hmac 模块,它内部对我们创建 key 和 内容 进行进一步的处理然后再加密
1 import hmac 2 3 h = hmac.new(bytes('898oaFs09f',encoding="utf-8")) 4 h.update(bytes('admin',encoding="utf-8")) 5 print(h.hexdigest())
7、request模块
Requests 是使用 Apache2 Licensed 许可证的 基于Python开发的HTTP 库,其在Python内置模块的基础上进行了高度的封装,从而使得Pythoner进行网络请求时,变得美好了许多,使用Requests可以轻而易举的完成浏览器可有的任何操作
安装:pip3 install requests
# 1、无参数实例 import requests ret = requests.get('https://github.com/timeline.json') print(ret.url) print(ret.text) # 2、有参数实例 import requests payload = {'key1': 'value1', 'key2': 'value2'} ret = requests.get("http://httpbin.org/get", params=payload) print(ret.url) print(ret.text)
# 1、基本POST实例 import requests payload = {'key1': 'value1', 'key2': 'value2'} ret = requests.post("http://httpbin.org/post", data=payload) print(ret.text) # 2、发送请求头和数据实例 import requests import json url = 'https://api.github.com/some/endpoint' payload = {'some': 'data'} headers = {'content-type': 'application/json'} ret = requests.post( url, data=json.dumps(payload), # json=payload 序列化成字节 headers=headers) print(ret.text) print(ret.cookies)
requests.get(url, params=None, **kwargs) requests.post(url, data=None, json=None, **kwargs) requests.put(url, data=None, **kwargs) requests.head(url, **kwargs) requests.delete(url, **kwargs) requests.patch(url, data=None, **kwargs) requests.options(url, **kwargs) # 以上方法均是在此方法的基础上构建 requests.request(method, url, **kwargs)