7.18 常用模块

一。collections

  collections模块中提供了除了dict,list,str等数据类型之外的其他数据类型:Counter、deque、defaultdict、namedtuple和OrderedDict等

    1.namedtuple: 生成可以使用名字来访问元素内容的tuple

    2.deque: 双端队列,可以快速的从另外一侧追加和推出对象

    3.Counter: 计数器,主要用来计数

    4.OrderedDict: 有序字典

    5.defaultdict: 带有默认值的字典

  1.namedtuple具名元组

  普通的元组不具有描述自己定义的数据的功能,而具名元组定义了一个可以描述元组的数据类型:

from collections import namedtuple
point = namedtuple('坐标',['x','y','z'])  
p = point(1,2,5)  
print(p)
print(type(p))
print(p.x)
print(p.y)
print(p.z)
#输出结果>>>坐标(x=1, y=2, z=5)
#<class '__main__.坐标'>
#1
#2
#5

  导入模块后,可以使用namedtuple调用函数,namedtuple可以传入两个参数,第一个是对元组的描述,第二个是可迭代对象,所以,除了列表,还可以写成这样:

point = namedtuple('坐标','x y z')

  注意,参数与参数之间需要使用空格隔开。

  定义好一个具名元组后,就可以对其进行传参了,传入的参数要与可迭代中的元素一样。

  2.deque

  补充:queue队列模块

# import queue
# q = queue.Queue() 
# q.put('first')  
# q.put('second')
# q.put('third')
# print(q.get()) 
# print(q.get())
# print(q.get())
# print(q.get()) 
#输出结果>>>first
#second
#third

  使用queue模块创建一个队列q,再使用put方法对其传值,使用get对其取值,当值被取完时继续调用get方法,等待列表给值。

  deque双端队列,是一个两边都可以取值和传值的队列。

from collections import deque
q = deque(['a','b','c'])
q.append('x')
print(q)
q.appendleft('y')
print(q)
q.pop()
print(q)
q.popleft()
print(q)
#输出结果>>>deque(['a', 'b', 'c', 'x'])
#deque(['y', 'a', 'b', 'c', 'x'])
#deque(['y', 'a', 'b', 'c'])
#deque(['a', 'b', 'c'])

  在deque中可以使用append和appendleft对队列进行左右 的加值,pop和popleft对其进行左右的删值。deque传值是传可迭代对象。

  在双端队列中可以使用insert对其进行索引取值,这是deque不合理的地方。

  3.Ordereddict有序字典

  在正常定义一个字典时,产生的字典是无序的,而使用ordereddict产生的字典是有序的。有序字典的定义方式是:

order_d = OrderedDict([('a',1),('b',2),('c',3)])

  其输出也是这个,并不会以无序字典的方式打印,或者

order_d1 = OrderedDict()
order_d1['x'] = 1
order_d1['y'] = 2
order_d1['z'] = 3
print(order_d1)
for i in order_d1:
    print(i)
print(order_d1)

  这个字典是可以使用for循环遍历取值的。使用keys()对其进行取值时会按照插入顺序,而不是key本身的顺序。

  4.defaultdict默认字典

  当你需要把列表中的值进行判断大小(66),,并对其值放入字典中,字典的value是一个列表,不用defaultdict可以使用如下办法。

values = [11, 22, 33,44,55,66,77,88,99,90]
my_dict = {}
for value in  values:
    if value>66:
        if my_dict.has_key('k1'):
            my_dict['k1'].append(value)
        else:
            my_dict['k1'] = [value]
    else:
        if my_dict.has_key('k2'):
            my_dict['k2'].append(value)
        else:
            my_dict['k2'] = [value]

  而使用了defaultdict()方法后x,对其传入一个数据类型,当字典被创建后,其value会被自动转换成传入的那个数据类型,所以上述题目可以简化成:

from collections import defaultdict
values = [11, 22, 33,44,55,66,77,88,99,90]
my_dict = defaultdict(list)
for value in  values:
    if value>66:
        my_dict['k1'].append(value)
    else:
        my_dict['k2'].append(value)

  使dict时,如果引用的Key不存在,就会抛出KeyError。如果希望key不存在时,返回一个默认值,就可以用defaultdict

>>> from collections import defaultdict
>>> dd = defaultdict(lambda: 'N/A')
>>> dd['key1'] = 'abc'
>>> dd['key1'] # key1存在
'abc'
>>> dd['key2'] # key2不存在,返回默认值
'N/A'

5.Counter计数

  当你需要统计一个字符串中某个字符出现的次数时,如题

s='aaaaabbbbbbvcccccc'
dict1=dict({})
for i in s:
    if i not in dict1:
        dict1[i]=1
    else:
        dict1[i]+=1
print(dict1)
#输出结果>>>{'a': 5, 'b': 6, 'v': 1, 'c': 6}

  而使用counter计数就可以直接生成字典:

from collections import Counter
s = 'abcdeabcdabcaba'
res = Counter(s)
print(res)
#输出结果>>>Counter({'a': 5, 'b': 4, 'c': 3, 'd': 2, 'e': 1})

二。time时间模块

  时间模块有三种表现形式:

  1.时间戳

  2.格式化时间(用来展示给人看的)

  3.结构化时间 

  1.time.time()

import time
print(time.time())
#输出结果>>>1563445995.928969

  输出的是现在的时间距离1970-1-1的秒数,

  2.strftime()

  格式化时间输出的时间比较工整,它与%s差不多,不过有特定的符号接受年月日、

print(time.strftime('%Y-%m-%d'))
print(time.strftime('%Y-%m-%d %H:%M:%S'))
#输出结果>>>2019-07-18
#2019-07-18 18:43:16

  如上,月和日的字符是小写,其他均为大写,使用%X可以代表时分秒。

  在strftime中还有其他的特殊字符,日后用作翻阅如:

%y 两位数的年份表示(00-99%Y 四位数的年份表示(000-9999%m 月份(01-12%d 月内中的一天(0-31%H 24小时制小时数(0-23%I 12小时制小时数(01-12%M 分钟数(00=59%S 秒(00-59%a 本地简化星期名称
%A 本地完整星期名称
%b 本地简化的月份名称
%B 本地完整的月份名称
%c 本地相应的日期表示和时间表示
%j 年内的一天(001-366%p 本地A.M.或P.M.的等价符
%U 一年中的星期数(00-53)星期天为星期的开始
%w 星期(0-6),星期天为星期的开始
%W 一年中的星期数(00-53)星期一为星期的开始
%x 本地相应的日期表示
%X 本地相应的时间表示
%Z 当前时区的名称
%% %号本身

  3.结构化时间

  使用time.local可以打印结构化时间, 

print(time.localtime())
#输出结果>>>time.struct_time(tm_year=2019, tm_mon=7, tm_mday=18, tm_hour=18, tm_min=51, tm_sec=5, tm_wday=3, tm_yday=199, tm_isdst=0)

  结构化时间中分别代表了以下值,用做以后索引:

索引(Index)属性(Attribute)值(Values)
0 tm_year(年) 比如2011
1 tm_mon(月) 1 - 12
2 tm_mday(日) 1 - 31
3 tm_hour(时) 0 - 23
4 tm_min(分) 0 - 59
5 tm_sec(秒) 0 - 60
6 tm_wday(weekday) 0 - 6(0表示周一)
7 tm_yday(一年中的第几天) 1 - 366
8 tm_isdst(是否是夏令时) 默认为0

  初次之外,字符串时间,结构化时间,格式化时间之间是可以互相转换的:

  时间戳转化为结构化时间:

print(time.localtime(time.time()))
#输出结果>>>time.struct_time(tm_year=2019, tm_mon=7, tm_mday=18, tm_hour=19, tm_min=13, tm_sec=1, tm_wday=3, tm_yday=199, tm_isdst=0)

  或者转换为伦敦时间:

print(time.gmtime(time.time()))
#输出结果>>>time.struct_time(tm_year=2019, tm_mon=7, tm_mday=18, tm_hour=11, tm_min=15, tm_sec=12, tm_wday=3, tm_yday=199, tm_isdst=0)

  结构化时间转换为时间戳:

res = time.localtime(time.time())
print(time.time())
print(time.mktime(res))
#输出结果>>>1563448581.7627177
#1563448581.0

  结构化时间转换为字符串时间:

print(time.strftime('%Y-%m',time.localtime()))
#输出结果>>>2019-07

  字符串时间转换为结构化时间:

print(time.strptime(time.strftime('%Y-%m',time.localtime()),'%Y-%m'))
#输出结果>>>time.struct_time(tm_year=2019, tm_mon=7, tm_mday=1, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=0, tm_yday=182, tm_isdst=-1)

  结构化时间转换成格式化串:

print(time.asctime(time.localtime(1500000000)))
print(time.asctime())
#输出结果>>>Fri Jul 14 10:40:00 2017
#Thu Jul 18 19:27:51 2019

  如果不传值,显示的是当前时间

  时间戳转化成格式化串

print(time.ctime())
print(time.ctime(1500000000))
#输出结果>>>Thu Jul 18 19:29:23 2019
#Fri Jul 14 10:40:00 2017

  time.sleep(n)

  将程序搁置n秒

  datetime模块

  显示年月日和年月日时分秒:

import datetime
print(datetime.date.today()) 
print(datetime.datetime.today())
#输出结果>>>2019-07-18
#2019-07-18 19:33:33.857248

  下面还有一些获取时间相关的方法:

import datetime
print(datetime.date.today())  # date>>>:年月日
print(datetime.datetime.today())  # datetime>>>:年月日 时分秒
res = datetime.date.today()
res1 = datetime.datetime.today()
print(res.year)
print(res.month)
print(res.day)
print(res.weekday())  # 0-6表示星期  0表示周一
print(res.isoweekday())
#输出结果>>>2019-07-18
#2019-07-18 19:38:59.237848
#2019
#7
#18
#3
#4

  其中,year获取年,month代表月,day代表日,weekday代表星期,但这里从0开始,代表星期一,isoweekday是代表真正的星期。

   在这个模块可以对时间进行计算

timetel_t = datetime.timedelta(days=7)  # timedelta对象
print(timetel_t)
#输出结果>>>7 days, 0:00:00

  timedelta是一个时间增量,在进行时间运算时,遵循以下规则:

  日期对象 = 日期对象 +/- timedelta对象

  timedelta对象 = 日期对象 +/- 日期对象,如:

current_time = datetime.date.today()  # 日期对象
timetel_t = datetime.timedelta(days=7)  # timedelta对象
print(timetel_t)
res1 = current_time+timetel_t  # 日期对象
print(current_time - timetel_t)
print(res1-current_time)
#输出结果>>>7 days, 0:00:00
#2019-07-11
#7 days, 0:00:00

  utc时间

dt_today = datetime.datetime.today()
dt_now = datetime.datetime.now()
dt_utcnow = datetime.datetime.utcnow()
print(dt_today)
print(dt_now)
print(dt_utcnow)
#输出结果>>>2019-07-18 19:56:12.536702
#2019-07-18 19:56:12.536702
#2019-07-18 11:56:12.536702

三。random模块

  random是获取随机数等随机项的模块

  如:random.randint(x,y)随机生成x到y之间的数

  random.random()随机生成0-1之间的小数。

  random.shuffle()对一个列表进行随机打乱。

  random.choice()对一个列表中的元素进行随机选择。

import random
print(random.randint(1,6))  # 随机取一个你提供的整数范围内的数字  包含首尾
print(random.random())  # 随机取0-1之间小数
print(random.choice([1,2,3,4,5,6]))  # 摇号 随机从列表中取一个元素
res = [1,2,3,4,5,6]
random.shuffle(res)  # 洗牌
print(res)
#输出结果>>>4
#0.394731321911586
#4
#[2, 1, 5, 3, 6, 4]

  小练习:生成n、位随机验证码,带有数字,大写字母和小写字母

def get_code(n):
    code = ''
    for i in range(n):
        # 先生成随机的大写字母 小写字母 数字
        upper_str = chr(random.randint(65,90))
        lower_str = chr(random.randint(97,122))
        random_int = str(random.randint(0,9))
        # 从上面三个中随机选择一个作为随机验证码的某一位
        code += random.choice([upper_str,lower_str,random_int])
    return code
res = get_code(4)
print(res)

四。os模块

  os模块是与操作系统进行对接的模块

  os.path.dirname(__file__) 获取该文件的上一层文件名

  os.path.join(x,y) 拼接地址

  os.listdir() 将该文件夹下的所有文件读取出看来,成为一个列表。

  os.mkdir('文件夹名'),生成一个文件夹,在当文件夹下

  os.path.exists()判断文件夹是否存在

  os.path.isfile(),判断文件是否存在,不能判断文件夹。

  os.rmdir(''),删除文件夹,(只能删除空文件夹)。

  os.chdir(''),切换到该目录里

  os.getcwd(),查看当前目录

  os.path.getsize(),获取文件大小,获取的是字节

  其他可能用到的如下:

os.makedirs('dirname1/dirname2')    可生成多层递归目录
os.removedirs('dirname1')    若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
os.mkdir('dirname')    生成单级目录;相当于shell中mkdir dirname
os.rmdir('dirname')    删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
os.listdir('dirname')    列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印
os.remove()  删除一个文件
os.rename("oldname","newname")  重命名文件/目录
os.stat('path/filename')  获取文件/目录信息

os.system("bash command")  运行shell命令,直接显示
os.popen("bash command).read()  运行shell命令,获取执行结果
os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径
os.chdir("dirname")  改变当前脚本工作目录;相当于shell下cd

os.path
os.path.abspath(path) 返回path规范化的绝对路径
os.path.split(path) 将path分割成目录和文件名二元组返回 
os.path.dirname(path) 返回path的目录。其实就是os.path.split(path)的第一个元素 
os.path.basename(path) 返回path最后的文件名。如何path以/或\结尾,那么就会返回空值。即os.path.split(path)的第二个元素
os.path.exists(path)  如果path存在,返回True;如果path不存在,返回False
os.path.isabs(path)  如果path是绝对路径,返回True
os.path.isfile(path)  如果path是一个存在的文件,返回True。否则返回False
os.path.isdir(path)  如果path是一个存在的目录,则返回True。否则返回False
os.path.join(path1[, path2[, ...]])  将多个路径组合后返回,第一个绝对路径之前的参数将被忽略
os.path.getatime(path)  返回path所指向的文件或者目录的最后访问时间
os.path.getmtime(path)  返回path所指向的文件或者目录的最后修改时间
os.path.getsize(path) 返回path的大小

五。sys模块

  sys模块是与python解释器打交道的

  sys.path.append(),将某个路径添加到系统环境变量的。

   sys.argv:在终端运行该文件可以获取终端输入的内容。并生成列表。

  其他内容:

sys.argv           命令行参数List,第一个元素是程序本身路径
sys.exit(n)        退出程序,正常退出时exit(0),错误退出sys.exit(1)
sys.version        获取Python解释程序的版本信息
sys.path           返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
sys.platform       返回操作系统平台名称

六。序列化模块

   序列:字符串

  序列化:其他数据类型转换成字符串的过程。 

  写入文件的数据必须是字符串,基于网络传输的数据必须是二进制

  反序列化:字符串转化成其他数据类型。

  在数据传输过程中都是以二进制传输,而且在不同语言之间需要进行序列和反序列,所有有一个模块可以进行之间的转化。

  json模块

  json是所有语言都支持的模块。

  json支持的数据类型比较少,如:字符串,列表,字典,整型,元组(转成列表)

  pickle模块

  pickle与json不同的是它只支持python的转化,但能转化所有数字类型

  在存数据如文件是,必须要经序列化。

  json.encoder,可以查询json中支持哪些数据类型的序列化

+-------------------+---------------+
| Python | JSON |
+===================+===============+
| dict | object |
+-------------------+---------------+
| list, tuple | array |
+-------------------+---------------+
| str | string |
+-------------------+---------------+
| int, float | number |
+-------------------+---------------+
| True | true |
+-------------------+---------------+
| False | false |
+-------------------+---------------+
| None | null |
+-------------------+---------------+

  除此之外其他都不支持,

d = {"name":"jason"}
print(d)
res = json.dumps(d)  
print(res,type(res))
res1 = json.loads(res)
print(res1,type(res1))
#输出结果>>>{'name': 'jason'}
#{"name": "jason"} <class 'str'>
#{'name': 'jason'} <class 'dict'>

  在json模块中,damps可以将字典转化成字典型的字符串,而loads可以将字典型的字符串转化成字典。

   dump和load

import json
f = open('json_file','w')
dic = {'k1':'v1','k2':'v2','k3':'v3'}
json.dump(dic,f)  
f.close()
f = open('json_file')
dic2 = json.load(f)  
f.close()
print(type(dic2),dic2)

  dump方法接收一个文件句柄,直接将字典转换成json字符串写入文件,而load方法接收一个文件句柄,直接将文件中的json字符串转换成数据结构返回。

  注意,在使用dump写入数据到文件中时,是不加空格的,所以要想写入多条数据可以使用dumps手动拼接回车符接在后面,在使用loads返回一行,循环。

d1 = {'name':'朱志坚'}
print(json.dumps(d1,ensure_ascii=False))
#输出结果>>>{"name": "朱志坚"}

  当使用dumps序列化时,可能会把其中的ascii码进行二进制转化,为了避免这种情况,可以使用ensure_ascii取false值使得其不转码。

  pickle模块

  在pickle模块中dumps方法会直接将对象转换成二进制,loads将其转换成原类型。

  在dump方法的使用中,文件的打开模式必须时b模式。

 七。subprocess子进程

  sub  子

  process 进程

   其中obj=subprocess.popen('文件名'shell=True,stdout=subprocess.PIPE,stderr=subprocess.PIPE)

  使用obj.stdout.read().decode("gbk')进行输出正确的指令进程

  使用obj.stderr.read()输出错误的指令

while True:
    cmd = input('cmd>>>:').strip()
    import subprocess
    obj = subprocess.Popen(cmd,shell=True,stdout=subprocess.PIPE,stderr=subprocess.PIPE)
    # print(obj)
    print('正确命令返回的结果stdout',obj.stdout.read().decode('gbk'))
    print('错误命令返回的提示信息stderr',obj.stderr.read().decode('gbk'))

   其应用范围是可以全程连接其他电脑,使用这个模块获取用户命令,执行命令,就实现了远程操作。

 

 

 

 

 

 

 

 

 

 

posted on 2019-07-18 22:06  一只萌萌哒的提莫  阅读(148)  评论(0编辑  收藏  举报