(5)PY_(study)

---恢复内容开始---

一,re 正则模块

二、time datetime 时间模块

三、random 模块

四、OS模块

五、sys模块

六、shutil模块

七、json&pickle模块

 

 

 

 

 

 

 

 

一,正则模块re

一:什么是正则?

 正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法。

import re

print(re.findall('\w','egon 123 = — - +')) #\w 匹配字母数字下划线

打印结果:['e', 'g', 'o', 'n', '1', '2', '3']

 

正则常用操作
# Author:land
#print(re.findall('\w','egon 123 + _ - +'))  #\w 匹配字母数字下划线


#?:   代表?号左边的字符出现0次或者1次

#*:   代表*号左边的字符出现0次或者无穷次

#+:   代表+号左边的字符出现1次或者无穷次

#{m,n}:   代表号左边的字符出现0次或者无穷次


#.*  贪婪匹配

#.*?  非贪婪匹配  (用这个)

#re.search()  #值匹配成功一次就返回
#re.match()   #从开头取



import re

# print(re.findall('\w','egon 123 = — - +')) #\w 匹配字母数字下划线
# print(re.findall('\W','egon 123 = — - +')) #\w 匹配非字母数字下划线
# print(re.findall('\s','egon 123 = — - +')) #\s 匹配任意空白字符
# print(re.findall('\S','egon 123 = — - +')) #\S

#重复. * ? + {m,n}

# . 代表匹配任意一个字符
# print(re.findall('a.b','alb a b a-b aaaaab'))
#                   # a.b
#
# print(re.findall('a.b','alb a\nb a-b aaaaab',re.DOTALL))  #匹配出\n



#? ?号代表她左边的字符出现0次或者1次
# print(re.findall('ab?','ab a b a-b abbbb'))

#* *号代表她左边的字符出现0次或者无穷次
# print(re.findall('ab*','ab a b a-b aabbbbb'))

#+  +号代表她左边的字符出现1次或者无穷次
# print(re.findall('ab+','ab a b a-b aabbbbb'))

# {m,n} 代表左边的字符出现m到n次
#print(re.findall('ab{1,3}','ab a b a-b aabbbbb'))


#.*  贪婪匹配
#print(re.findall('a.*b','ab  jfnj cc xxxxaayyybbbbb'))

#.*?  非贪婪匹配  常用
#print(re.findall('a.*?b','ab  jfnj cc xxxxaayyybbbbb'))


#| 或者
# print(re.findall('compla(y|ies)','too  girl complay  and  complaies'))
# print(re.findall('compla(?:y|ies)','too  complay  and  complaies'))


# print(re.findall(r'a\\c','a\c alc aBc'))  #r的意思是不要做语法级别的转义                                         #不加r会报错
# print(re.findall('a\\\\c','a\c alc aBc'))  #不加r的时候

#[]  去[]号内任意一个字符


#re模块其他方法
#re.search()    只匹配成功一次就返回
# print(re.search('a[^-+*/]b','axb azb aAb alb a-b a+b'))
# print(re.search('a[*]b','axb azb aAb alb a-b a+b'))  #没结果返回none
# print(re.search('a[0-9]b','axb azb aAb a2b a-b a+b').group())

#re.split()   以冒号分割
#print(re.split(':','root:x:0:0::/root:/bin/bash'))

#re.sub()  就替换的意思
print(re.sub('root','admin','root:x::0:0:/bin/bash'))  #把root替换为admin

#re.compile()

 

二、time 时间模块

在Python中,通常有这几种方式来表示时间:

  • 时间戳(timestamp):通常来说,时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量。我们运行“type(time.time())”,返回的是float类型。
  • 格式化的时间字符串(Format String)
  • 结构化的时间(struct_time):struct_time元组共有9个元素共九个元素:(年,月,日,时,分,秒,一年中第几周,一年中第几天,夏令时)
# Author:land
import time

#print(time.time())
#print(time.localtime())  #结构化时间
#print(time.localtime().tm_mday)

#print(time.gmtime())

print(time.strftime('%Y-%m-%d %H:%M:%S'))

 

import datetime

print(datetime.datetime.now())
print(datetime.datetime.fromtimestamp(2222222))

print(datetime.datetime.now()+datetime.timedelta(days=3))  #3天以后的时间
print(datetime.datetime.now()+datetime.timedelta(days=-3))  #3天以前的时间
print(datetime.datetime.now()+datetime.timedelta(hours=3))  #3小时以后的时间

print(datetime.datetime.now().replace(year=1999,hour=12))

 

三、random 模块

# Author:land
import random

# print(random.random())  #取0-1之间的小树
# print(random.randint(1,3))
# print(random.randrange(1,3))
# print(random.choice([1,'jdu','fg']))
#
# print(random.uniform(1,3))

#随机生成字母数字验证码
def mak_code(n):
    res=''                       #定义一个空字符串
    for i in range(n):
        s1=str(random.randint(0,9))    #获取一盒随机整数 然后转换成字符
        s2=chr(random.randint(65,90))   #获取A-Z的大写字母
        res+=random.choice([s1,s2])     #然后随机选择一个进行相加n次
    return res   #返回res

print(mak_code(4))

 

四、OS模块

os模块是与操作系统交互的一个接口

os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径
os.chdir("dirname")  改变当前脚本工作目录;相当于shell下cd
os.curdir  返回当前目录: ('.')
os.pardir  获取当前目录的父目录字符串名:('..')
os.makedirs('dirname1/dirname2')    可生成多层递归目录
os.removedirs('dirname1')    若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
os.mkdir('dirname')    生成单级目录;相当于shell中mkdir dirname
os.rmdir('dirname')    删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
os.listdir('dirname')    列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印
os.remove()  删除一个文件
os.rename("oldname","newname")  重命名文件/目录
os.stat('path/filename')  获取文件/目录信息
os.sep    输出操作系统特定的路径分隔符,win下为"\\",Linux下为"/"
os.linesep    输出当前平台使用的行终止符,win下为"\t\n",Linux下为"\n"
os.pathsep    输出用于分割文件路径的字符串 win下为;,Linux下为:
os.name    输出字符串指示当前使用平台。win->'nt'; Linux->'posix'
os.system("bash command")  运行shell命令,直接显示
os.environ  获取系统环境变量
os.path.abspath(path)  返回path规范化的绝对路径
os.path.split(path)  将path分割成目录和文件名二元组返回
os.path.dirname(path)  返回path的目录。其实就是os.path.split(path)的第一个元素
os.path.basename(path)  返回path最后的文件名。如何path以/或\结尾,那么就会返回空值。即os.path.split(path)的第二个元素
os.path.exists(path)  如果path存在,返回True;如果path不存在,返回False
os.path.isabs(path)  如果path是绝对路径,返回True
os.path.isfile(path)  如果path是一个存在的文件,返回True。否则返回False
os.path.isdir(path)  如果path是一个存在的目录,则返回True。否则返回False
os.path.join(path1[, path2[, ...]])  将多个路径组合后返回,第一个绝对路径之前的参数将被忽略
os.path.getatime(path)  返回path所指向的文件或者目录的最后存取时间
os.path.getmtime(path)  返回path所指向的文件或者目录的最后修改时间
os.path.getsize(path) 返回path的大小

 

五、sys模块

1 sys.argv           命令行参数List,第一个元素是程序本身路径
2 sys.exit(n)        退出程序,正常退出时exit(0)
3 sys.version        获取Python解释程序的版本信息
4 sys.maxint         最大的Int值
5 sys.path           返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
6 sys.platform       返回操作系统平台名称

 

 六、shutil模块

 

高级的 文件、文件夹、压缩包 处理模块

shutil.copyfileobj(fsrc, fdst[, length])
将文件内容拷贝到另一个文件中

1 import shutil
2  
3 shutil.copyfileobj(open('old.xml','r'), open('new.xml', 'w'))

 

shutil.copyfile(src, dst)
拷贝文件

1 shutil.copyfile('f1.log', 'f2.log') #目标文件无需存在

 

shutil.copymode(src, dst)
仅拷贝权限。内容、组、用户均不变

1 shutil.copymode('f1.log', 'f2.log') #目标文件必须存在

 

shutil.copystat(src, dst)
仅拷贝状态的信息,包括:mode bits, atime, mtime, flags

1 shutil.copystat('f1.log', 'f2.log') #目标文件必须存在

 

shutil.copy(src, dst)
拷贝文件和权限

1 import shutil
2  
3 shutil.copy('f1.log', 'f2.log')

 

shutil.copy2(src, dst)
拷贝文件和状态信息

1 import shutil
2  
3 shutil.copy2('f1.log', 'f2.log')

 

shutil.ignore_patterns(*patterns)
shutil.copytree(src, dst, symlinks=False, ignore=None)
递归的去拷贝文件夹

1 import shutil
2  
3 shutil.copytree('folder1', 'folder2', ignore=shutil.ignore_patterns('*.pyc', 'tmp*')) #目标目录不能存在,注意对folder2目录父级目录要有可写权限,ignore的意思是排除 

 

七、json&pickle模块

 用eval内置方法可以将一个字符串转成python对象,不过,eval方法是有局限性的,对于普通的数据类型,json.loads和eval都能用,但遇到特殊类型的时候,eval就不管用了,所以eval的重点还是通常用来执行一个字符串表达式,并返回表达式的值。

 

什么是序列化?

我们把对象(变量)从内存中变成可存储或传输的过程称之为序列化,在Python中叫pickling,在其他语言中也被称之为serialization,marshalling,flattening等等,都是一个意思。

为什么要序列化?

1:持久保存状态

需知一个软件/程序的执行就在处理一系列状态的变化,在编程语言中,'状态'会以各种各样有结构的数据类型(也可简单的理解为变量)的形式被保存在内存中。

内存是无法永久保存数据的,当程序运行了一段时间,我们断电或者重启程序,内存中关于这个程序的之前一段时间的数据(有结构)都被清空了。

在断电或重启程序之前将程序当前内存中所有的数据都保存下来(保存到文件中),以便于下次程序执行能够从文件中载入之前的数据,然后继续执行,这就是序列化。

具体的来说,你玩使命召唤闯到了第13关,你保存游戏状态,关机走人,下次再玩,还能从上次的位置开始继续闯关。或如,虚拟机状态的挂起等。

2:跨平台数据交互

序列化之后,不仅可以把序列化后的内容写入磁盘,还可以通过网络传输到别的机器上,如果收发的双方约定好实用一种序列化的格式,那么便打破了平台/语言差异化带来的限制,实现了跨平台数据交互。

反过来,把变量内容从序列化的对象重新读到内存里称之为反序列化,即unpickling。

如何序列化之json和pickle:

json

 

如果我们要在不同的编程语言之间传递对象,就必须把对象序列化为标准格式,比如XML,但更好的方法是序列化为JSON,因为JSON表示出来就是一个字符串,可以被所有语言读取,也可以方便地存储到磁盘或者通过网络传输。JSON不仅是标准格式,并且比XML更快,而且可以直接在Web页面中读取,非常方便。

JSON表示的对象就是标准的JavaScript语言的对象,JSON和Python内置的数据类型对应如下:

 

 1 import json
 2  
 3 dic={'name':'alvin','age':23,'sex':'male'}
 4 print(type(dic))#<class 'dict'>
 5  
 6 j=json.dumps(dic)
 7 print(type(j))#<class 'str'>
 8  
 9  
10 f=open('序列化对象','w')
11 f.write(j)  #-------------------等价于json.dump(dic,f)
12 f.close()
13 #-----------------------------反序列化<br>
14 import json
15 f=open('序列化对象')
16 data=json.loads(f.read())#  等价于data=json.load(f)

 

 

1 import pickle
 2  
 3 dic={'name':'alvin','age':23,'sex':'male'}
 4  
 5 print(type(dic))#<class 'dict'>
 6  
 7 j=pickle.dumps(dic)
 8 print(type(j))#<class 'bytes'>
 9  
10  
11 f=open('序列化对象_pickle','wb')#注意是w是写入str,wb是写入bytes,j是'bytes'
12 f.write(j)  #-------------------等价于pickle.dump(dic,f)
13  
14 f.close()
15 #-------------------------反序列化
16 import pickle
17 f=open('序列化对象_pickle','rb')
18  
19 data=pickle.loads(f.read())#  等价于data=pickle.load(f)
20  
21  
22 print(data['age']) 

 

posted @ 2018-05-08 23:20  莱昂嘚  阅读(225)  评论(0编辑  收藏  举报