Python基础(十)-模块

模块初识

一般把不同功能代码放到不同py文件,一个py文件就是一个模块

三种模块库:

1、Python标准库

2、第三方库

3、自定义库

导入模块:import 库名 (Python解释器只认识执行文件的路径(sys.path),导入自定义库时也只会从执行文件的路径开始找

import sys
print(sys.path)

结果:
['E:\\PyCharm\\Personal_practice\\cmdb', 'E:\\PyCharm\\Personal_practice\\cmdb', 'D:\\Program Files (x86)\\python\\python35\\python35.zip', 'D:\\Program Files (x86)\\python\\python35\\DLLs', 'D:\\Program Files (x86)\\python\\python35\\lib', 'D:\\Program Files (x86)\\python\\python35', 'D:\\Program Files (x86)\\python\\python35\\lib\\site-packages']

 

导入后的两个效果:

1、先执行模块所有代码 2、引入变量名

引入多个模块:import a,b,c

导入模块并重命名:from project.app01 import views as v

在调用模块下方法时,不建议 from a import *  (全部引入)这么写可能会与自己当前定义的函数冲突

包:

用来组织模块,避免模块名重复产生冲突(文件夹中包含__init.py__文件)

导入模块时,解释器解释该py文件
当导入包(文件夹)时,解释器解释__init__.py文件

 

模块导入过程详解

在Python中使用import语句导入模块时,python通过三个步骤来完成这个行为。 
1:在python模块加载路径中查找相应的模块文件 
2:将模块文件编译成中间代码 
3:执行模块文件中的代码

在python中模块的导入动作只发生一次。也就是说当一个模块在一个文件中被导入过一次以后,当另外的文件继续需要导入这个模块时,python首先会在sys.modules这个变量中查出是否已经
导入过这个模块,如果已经导入过则上面三个步骤不会执行,直接引用之前导入的内存中的内容。 在步骤2中,python首先会查找对应模块的.pyc文件,看该文件的最后修改时间是否比对应的.py文件的走后修改时间早,如果遭遇.py文件的最后修改时间,则重新编译模块并重新生成
字节码文件。注意,一个python程序的顶层文件不会生成.pyc文件。
当python完成步骤2以后会执行python文件中的语句,以生成对应的对象属性,比如def语句生成该模块的一个函数属性等。因为这个特性,假如模块中有一个print语句 ,
那么, 当该模块被第一次加载的时候,该输出语句就会将内容输出,但是由于模块只能被import一次,所以,当模块第二次被加载的时候,上面这三个步骤都不会被执行,
那么,这个输出不会再次出现。

 

多层包调用:

假如引入模块a.py在执行文件b同级目录c下里,在b中引入模块a:from c import a

假如引入模块a.py在执行文件b同级目录c/d下里,在b中引入模块a: from c.d import a

   调用a下cal方法:a.cal() 或者 from c.d.a import cal   cal()

 

__name__使用:

if __name__=='__main__' 在执行文件才成立

1.用于调用文件,测试模块代码(返回是文件名)

2.用于执行文件,强调不可调用

 

常用模块介绍

1、time模块

 1 import time
 2 print(time.time())  #时间戳-计算
 3 print(time.localtime(time.time()))  #结构化时间-显示  struct_time
 4 print(time.gmtime())  #0时区结构化时间
 5 print(time.mktime(time.localtime()))  #结构化时间转化成时间戳
 6 print(time.strftime('%Y-%m-%d %X',time.localtime()))  #结构化时间转化成字符串时间(格式化时间format)
 7 print(time.strptime('2016-12-12 18:22:56','%Y-%m-%d %X'))  # format时间转化成结构化时间
 8 
 9 print(time.ctime())
10 print(time.ctime(1423441244))  #将时间戳直接转化成字符串时间固定格式(%a %b %d %H:%M:%S %Y)
11 
12 print(time.asctime()) #等同下条
13 print(time.strftime('%a %b %d %H:%M:%S %Y',time.localtime()))  #将结构化时间转化成字符串时间格式同上
14 
15 #执行结果
16 1481596470.6987557
17 time.struct_time(tm_year=2016, tm_mon=12, tm_mday=13, tm_hour=10, tm_min=34, tm_sec=30, tm_wday=1, tm_yday=348, tm_isdst=0)
18 time.struct_time(tm_year=2016, tm_mon=12, tm_mday=13, tm_hour=2, tm_min=34, tm_sec=30, tm_wday=1, tm_yday=348, tm_isdst=0)
19 1481596470.0
20 2016-12-13 10:34:30
21 time.struct_time(tm_year=2016, tm_mon=12, tm_mday=12, tm_hour=18, tm_min=22, tm_sec=56, tm_wday=0, tm_yday=347, tm_isdst=-1)
22 Tue Dec 13 10:34:30 2016
23 Mon Feb  9 08:20:44 2015
24 Tue Dec 13 10:34:30 2016
25 Tue Dec 13 10:34:30 2016

 

两张图搞定time模块之间关系:

2、random模块

 1 import random
 2 
 3 print(random.random())  #返回固定取值范围0到1之间的随机浮点数
 4 print(random.uniform(1,4)) #随机返回可定义取值范围1到4之间的浮点数
 5 
 6 print(random.randint(1,4))  #两个值[1,4]随机返回定义取值范围内的一个整数
 7 print(random.randrange(1,4))  #[1,4)和range一样  同上
 8 
 9 print(random.choice([1,2,3,[1],'123'])) #随机返回一个值
10 print(random.sample([1,2,3,[1],'123'],3))  #随机返回定义的几个值
11 
12 f=[1,2,'3']
13 random.shuffle(f)    #返回打乱顺序的列表
14 print(f)
15 
16 ###执行结果
17 0.2171299686228637
18 3.7457633609923873
19 2
20 1
21 2
22 ['123', 1, 3]
23 ['3', 2, 1]

 

生成验证码:

 1 import random
 2 def v_code():
 3     code=''
 4     for i in range(5):
 5         num=random.randint(0,9)
 6         alf=chr(random.randint(65,90))
 7         add=random.choice([num,alf])
 8         code+=str(add)
 9     return code
10 print(v_code())
View Code

 

3、os模块

os.getcwd()  #获取当前工作目录,即当前python脚本工作的目录路径
os.chdir("dirname")  #改变当前脚本工作目录;相当于shell下cd
os.curdir  #返回当前目录: ('.')
os.pardir  #获取当前目录的父目录字符串名:('..')
os.makedirs('dirname1/dirname2')   #可生成多层递归目录
os.removedirs('dirname1')    #若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
os.mkdir('dirname')    #生成单级目录;相当于shell中mkdir dirname
os.rmdir('dirname')    #删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
os.listdir('dirname')    #列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印
os.remove()  #删除一个文件
os.rename("oldname","newname")  #重命名文件/目录
os.stat('path/filename')  #获取文件/目录信息
os.sep    #输出操作系统特定的路径分隔符,win下为"\\",Linux下为"/"
os.linesep    #输出当前平台使用的行终止符,win下为"\t\n",Linux下为"\n"
os.pathsep    #输出用于分割文件路径的字符串 win下为;,Linux下为:
os.name    #输出字符串指示当前使用平台。win->'nt'; Linux->'posix'
os.system("bash command")  #运行shell命令,直接显示
os.environ  #获取系统环境变量
os.path.abspath(path)  #返回path规范化的绝对路径
os.path.split(path)  #将path分割成目录和文件名二元组返回
os.path.dirname(path)  #返回path的目录。其实就是os.path.split(path)的第一个元素
os.path.basename(path)  #返回path最后的文件名。如何path以/或\结尾,那么就会返回空值。即os.path.split(path)的第二个元素
os.path.exists(path)  #如果path存在,返回True;如果path不存在,返回False
os.path.isabs(path)  #如果path是绝对路径,返回True
os.path.isfile(path)  #如果path是一个存在的文件,返回True。否则返回False
os.path.isdir(path)  #如果path是一个存在的目录,则返回True。否则返回False
os.path.join(path1[, path2[, ...]])  #将多个路径组合后返回,第一个绝对路径之前的参数将被忽略
os.path.getatime(path)  #返回path所指向的文件或者目录的最后存取时间
os.path.getmtime(path)  #返回path所指向的文件或者目录的最后修改时间
View Code

 

4、sys模块

sys.argv           命令行参数List,第一个元素是程序本身路径
sys.exit(n)        退出程序,正常退出时exit(0)
sys.version        获取Python解释程序的版本信息
sys.maxint         最大的Int值
sys.path           返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
sys.platform       返回操作系统平台名称
#进度条显示
import sys
import time
for i in range(100):
    sys.stdout.write('#')
    time.sleep(0.1)
    sys.stdout.flush()
View Code

 

5、re模块

正则表达式用来对字符串进行模糊匹配(功能比字符串方法强大很多,我懂的)

元字符:

 1 . 通配符 可以替代所有字符除了换行符\n
 2 ^ 匹配开头
 3 $ 匹配结束
 4 
 5 
 6 * 匹配0到无穷次
 7 + 匹配1到无穷次
 8 ? 匹配0到1次
 9 {} 自定义匹配次数
10 
11 [] 字符集  只认识三种特殊字符: -(取值范围) ^(非) \(转移符),其他均为普通字符
12 |  表示或 管道两侧整体作为元素
13 () 分组符
14 \  转移符 

 

1 \d  匹配任何十进制数;它相当于类 [0-9]。
2 \D 匹配任何非数字字符;它相当于类 [^0-9]。
3 \s  匹配任何空白字符;它相当于类 [ \t\n\r\f\v]。
4 \S 匹配任何非空白字符;它相当于类 [^ \t\n\r\f\v]。
5 \w 匹配任何字母数字字符;它相当于类 [a-zA-Z0-9_]。
6 \W 匹配任何非字母数字字符;它相当于类 [^a-zA-Z0-9_]
7 \b  匹配一个特殊字符边界,比如空格 ,&,#等
###事例###

print(re.findall('abc*','ab'))
print(re.findall('abc*','abccccabdd'))
print(re.findall('abc+','ababccc'))
print(re.findall('^abc','abcabccc'))
print(re.findall('^abcd','abcabccc'))

print(re.findall('abc?','ababcccc'))

print(re.findall('abc{3}','abccabcccccc'))

print(re.findall('[a-c]','ab9999cwzAA'))   #['a', 'b', 'c']
print(re.findall('[a-c]+','ab9999cwzAA'))  #['ab', 'c']
print(re.findall('[^0-9]+','abc99cdd11cc'))  #['abc', 'cdd', 'cc']
print(re.findall('[a\\\\c]+','a\cccc'))    #python解释器 re模块 都有转义 ['a\\cccc']
print(re.findall(r'[a\\c]+','a\cccc'))                 #['a\\cccc']

print(re.findall('a|bc','babcbabccc'))  #['a', 'bc', 'a', 'bc']

print(re.findall(r'I\b','I am I&nnnnn'))

print(re.findall('a(bc)+','abcabcbccc'))  #显示(bc)其实匹配的是a(bc)+
print(re.findall('a(?:bc)+','abcabcbccc'))   # ?: 去除分组优先级 正常输出匹配['abc','abcbc']
print(re.findall('(?:abc)+','abcabccccadc'))

ret=re.search('(?P<id>\d{2})/(?P<name>\w{3})','23/com')
print(ret.group())       #23/com
print(ret.group('id'))   #23
print(ret.group('name')) #com


* + ? {}都是贪婪匹配,尽可能多的匹配,加上?就变成惰性匹配
print(re.findall('abc*?','abccccc') #返回['ab']

re模块常用方法:

 1 re.findall('ab','abcabc')  #列表返回所有匹配字符串['ab','ab']
 2 
 3 print(re.search('abc','abcabcabc').group())  #匹配第一个立即返回一个匹配对象,没匹配到返回None
 4                                  <_sre.SRE_Match object; span=(0, 3), match='abc'>
 5                                  通过group()方法取值
 6 
 7 re.match()  #相当于re.search() 但是只匹配开头
 8 
 9 ret=re.split('[ab]','abcd')     #先按'a'分割得到''和'bcd',在对''和'bcd'分别按'b'分割
10 print(ret)#['', '', 'cd']
11 
12 print(re.sub('\d','A','123abc3d'))   #AAAabcAd  默认替换所有
13 print(re.sub('\d','A','123abc3d',2)) #AA3abc3d 指定替换个数
14 print(re.subn('\d','A','123abc3d'))  #('AAAabcAd', 4)
15 print(re.subn('\d','A','123abc3d',2))#('AA3abc3d', 2)  只是返回值不同

 

6、hashlib

用于加密相关的操作,代替了md5模块和sha模块,主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ,MD5 算法

import hashlib
 
# ######## md5 ######## 不能反解
hash = hashlib.md5()
# help(hash.update)
hash.update(bytes('admin', encoding='utf-8'))
print(hash.hexdigest())   '21232f297a57a5a743894a0e4a801fc3'
print(hash.digest())      b'!#/)zW\xa5\xa7C\x89J\x0eJ\x80\x1f\xc3'
 
 
######## sha1 ########
 
hash = hashlib.sha1()
hash.update(bytes('admin', encoding='utf-8'))
print(hash.hexdigest())
 
# ######## sha256 ########
 
hash = hashlib.sha256()
hash.update(bytes('admin', encoding='utf-8'))
print(hash.hexdigest())
 
 
# ######## sha384 ########
 
hash = hashlib.sha384()
hash.update(bytes('admin', encoding='utf-8'))
print(hash.hexdigest())
 
# ######## sha512 ########
 
hash = hashlib.sha512()
hash.update(bytes('admin', encoding='utf-8'))
print(hash.hexdigest())

以上加密算法虽然依然非常厉害,但时候存在缺陷,即:通过撞库可以反解。所以,有必要对加密算法中添加自定义key再来做加密。

1 import hashlib
2  
3 # ######## md5 ########
4  
5 hash = hashlib.md5(bytes('898oaFs09f',encoding="utf-8"))
6 hash.update(bytes('admin',encoding="utf-8"))
7 print(hash.hexdigest())

python内置还有一个 hmac 模块,它内部对我们创建 key 和 内容 进行进一步的处理然后再加密

1 import hmac
2  
3 h = hmac.new(bytes('898oaFs09f',encoding="utf-8"))
4 h.update(bytes('admin',encoding="utf-8"))
5 print(h.hexdigest())

 

7、request模块

Requests 是使用 Apache2 Licensed 许可证的 基于Python开发的HTTP 库,其在Python内置模块的基础上进行了高度的封装,从而使得Pythoner进行网络请求时,变得美好了许多,使用Requests可以轻而易举的完成浏览器可有的任何操作

安装:pip3 install requests

# 1、无参数实例
 
import requests
 
ret = requests.get('https://github.com/timeline.json')
 
print(ret.url)
print(ret.text)
 
 
 
# 2、有参数实例
 
import requests
 
payload = {'key1': 'value1', 'key2': 'value2'}
ret = requests.get("http://httpbin.org/get", params=payload)
 
print(ret.url)
print(ret.text)
GET请求
# 1、基本POST实例
 
import requests
 
payload = {'key1': 'value1', 'key2': 'value2'}
ret = requests.post("http://httpbin.org/post", data=payload)
 
print(ret.text)
 
 
# 2、发送请求头和数据实例
 
import requests
import json
 
url = 'https://api.github.com/some/endpoint'
payload = {'some': 'data'}
headers = {'content-type': 'application/json'}
 
ret = requests.post(
          url, 
          data=json.dumps(payload),  # json=payload 序列化成字节
          headers=headers)
 
print(ret.text)
print(ret.cookies)
POST请求
requests.get(url, params=None, **kwargs)
requests.post(url, data=None, json=None, **kwargs)
requests.put(url, data=None, **kwargs)
requests.head(url, **kwargs)
requests.delete(url, **kwargs)
requests.patch(url, data=None, **kwargs)
requests.options(url, **kwargs)
 
# 以上方法均是在此方法的基础上构建
requests.request(method, url, **kwargs)
其他请求

 

posted @ 2016-12-13 10:38  chenzhuo  阅读(319)  评论(0编辑  收藏  举报