Python 常用模块
os
os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径 os.chdir("dirname") 改变当前脚本工作目录;相当于shell下cd os.curdir 返回当前目录: ('.') os.pardir 获取当前目录的父目录字符串名:('..') os.makedirs('dirname1/dirname2') 可生成多层递归目录 os.removedirs('dirname1') 若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推 os.mkdir('dirname') 生成单级目录;相当于shell中mkdir dirname os.rmdir('dirname') 删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname os.listdir('dirname') 列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印 os.remove() 删除一个文件 os.mknod("test.txt") 创建空文件 os.rename("oldname","newname") 重命名文件/目录 os.sep 输出操作系统特定的路径分隔符,win下为"\\",Linux下为"/" os.linesep 输出当前平台使用的行终止符,win下为"\t\n",Linux下为"\n" os.pathsep 输出用于分割文件路径的字符串 os.name 输出字符串指示当前使用平台。win->'nt'; Linux->'posix' os.system("bash command") 运行shell命令,直接显示 os.environ 获取系统环境变量 os.path.abspath(path) 返回path规范化的绝对路径 os.path.split(path) 将path分割成目录和文件名二元组返回 os.path.dirname(path) 返回path的目录。其实就是os.path.split(path)的第一个元素 os.path.basename(path) 返回path最后的文件名。如何path以/或\结尾,那么就会返回空值。即os.path.split(path)的第二个元素 os.path.exists(path) 如果path存在,返回True;如果path不存在,返回False os.path.isabs(path) 如果path是绝对路径,返回True os.path.isfile(path) 如果path是一个存在的文件,返回True。否则返回False os.path.isdir(path) 如果path是一个存在的目录,则返回True。否则返回False os.path.join(path1[, path2[, ...]]) 将多个路径组合后返回,第一个绝对路径之前的参数将被忽略 os.path.getatime(path) 返回path所指向的文件或者目录的最后存取时间 os.path.getmtime(path) 返回path所指向的文件或者目录的最后修改时间 os.path.getsize(path) 返回文件大小 os.path.normcase('/DasdASD/asdasdA/') 跨平台转换路径,转换大写为小写 os.path.normcase(os.path.join(os.path.dirname(os.path.abspath(__file__)),os.path.pardir)) os.get_terminal_size() 获取终端大小 os.chmod('jjj',0700) 权限 os.chown('jjj',UID,GID) 属主属组 os.stat('path/filename') 获取文件/目录信息 f = open('aaa.log') f2 = open('bbb.log', 'w') shutil.copyfileobj(f, f2, length=3*1024) # 将文件内容拷贝到另一个文件 shutil.copyfile('aaa.log', 'bbb.log') # 同上 shutil.copymode('aa', 'bb') # 拷贝权限,内容、用户、组不变 shutil.copytree(src, dst, ignore=shutil.ignore_patterns('atm')) # 递归复制目录 shutil.rmtree('asd') # 删除目录 shutil.make_archive("压缩包名", "zip", "要压缩的目录") # 压缩文件
time
t = time.localtime(time.time()-86400) # 返回本地时间 print(t.tm_year, t.tm_mon) # 时间戳 time.time() # 格式化前一天时间 t = time.localtime(time.time()-86400) time.strftime('%Y/%m/%d %H:%M:%S %W', t) # 日期字符串转换成时间对象 time_str = '2019-11-12 11:11:11' f = time.strptime(time_str, '%Y-%m-%d %H:%M:%S') print(f) # time.struct_time(tm_year=2019, tm_mon=11, tm_mday=12, tm_hour=11, tm_min=11, tm_sec=11, tm_wday=1, tm_yday=316, tm_isdst=-1) # 将时间对象转换成时间戳 print(time.mktime(f)) # 将时间戳转为字符串格式 print(time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time())))
datetime
import datetime print(datetime.datetime.now()) #返回 2016-08-19 12:47:03.941925 print(datetime.date.fromtimestamp(time.time()) ) # 时间戳直接转成日期格式 2016-08-19 print(datetime.datetime.now() ) print(datetime.datetime.now() + datetime.timedelta(3)) #当前时间+3天 print(datetime.datetime.now() + datetime.timedelta(-3)) #当前时间-3天 print(datetime.datetime.now() + datetime.timedelta(hours=3)) #当前时间+3小时 print(datetime.datetime.now() + datetime.timedelta(minutes=30)) #当前时间+30分 datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S") 时间对象与字符串互转 datetime.datetime.fromtimestamp(141456567) 时间对象与时间戳互转 time.mktime(datetime.datetime.now().timetuple()) 转换成秒
random 随机数
import random print ('小于1的随机浮点数:', random.random()) print ('指定范围内的随机浮点数:', random.uniform(20,30)) print ('指定范围内的随机整数:', random.randint(1,2)) print ('按指定步长集合中获取一个随机数', random.randrange(1,10,3)) # 步长 print (random.randrange(1,10)) # 不包含10 print('获取指定长度的序列: ', random.sample([1,2,3,4,5],3)) # 返回随机列表
zip
接收多个序列作为参数,返回一个元组列表
x = [1, 2, 3] y = [4, 5, 6,444] z = [7, 8, 9] xyz = zip(x, y, z) list(xyz) # [(1, 4, 7), (2, 5, 8), (3, 6, 9)] x = [1, 2, 3] r = zip(* [x] * 3) list(r) # [(1, 1, 1), (2, 2, 2), (3, 3, 3)]
string 字符串处理
import string print('小写字母: ',string.ascii_lowercase) print('大写字母: ', string.ascii_uppercase) print('大写和小写字母: ', string.ascii_letters) print('数字: ', string.digits) print('所有符号: ', string.printable)
序列化 json与pickle
- JSON是文本形式的存储,Pickle则是二进制形式(至少常用二进制)
- JSON是人可读的,Pickle不可读
- JSON广泛应用于除Python外的其他领域,Pickle是Python独有的。
- JSON只能dump一些python的内置对象,Pickle可以存储几乎所有对象。
在我看来,如果偏向应用特别是web应用方面,可以常用JSON格式。如果偏向算法方面,尤其是机器学习,则应该使用cPickle,pylearn2库中保存model就是使用这项技术的
有如下对象
data = { 'id': 1234, 'credit': 15000, 'balance': 8000, 'create_date': '2015-04-04' }
pickle
dumps and loads
t = pickle.dumps(data) # data type is obj t2 = pickle.loads(t) # t type is str print('t: ', type(t),t) print('t2: ', type(t),t2) 返回: t: <class 'bytes'> b'\x80\x03}q\x00(X\x06\x00\x00\x00creditq\x01M\x98:X\x07\x00\x00\x00balanceq\x02M@\x1fX\x0b\x00\x00\x00create_dateq\x03X\n\x00\x00\x002015-04-04q\x04X\x02\x00\x00\x00idq\x05M\xd2\x04u.' t2: <class 'bytes'> {'credit': 15000, 'balance': 8000, 'create_date': '2015-04-04', 'id': 1234}
dump and load
with open('test', 'wb') as f: pickle.dump(data, f) # pickle对象(字符串)-->python对象 从文件读取 with open('test', 'rb') as f: ret = pickle.load(f) print('pickle.load: ', ret)
json
json只支持 str int float set dict list tuple
dumps and loads
json_dumps = json.dumps(data) # 对象-->字符串 json_loads = json.loads(json_dumps) # 字符串-->对象 print('json_dumps ', type(json_dumps),json_dumps) print('json_loads ', type(json_loads),json_loads) 返回: json_dumps <class 'str'> {"create_date": "2015-04-04", "balance": 8000, "credit": 15000, "id": 1234} json_loads <class 'dict'> {'balance': 8000, 'credit': 15000, 'create_date': '2015-04-04', 'id': 1234}
dump and load
# 对象-->字符串,保存到文件 with open('test', 'w') as f: json.dump(data, f) # 从文件中读取,字符串-->对象, with open('test', 'r') as f: ret = json.load(f) print(ret) # return:{'credit': 15000, 'id': 1234, 'create_date': '2015-04-04', 'balance': 8000}
PyYAML
import yaml # 反序列化, 从文件中读取数据, 转成字典对象, data_dic = yaml.load(open("salt",encoding="utf-8")) print(type(data_dic)) # 序列化, 字段对象转成字符串 data_bytes = yaml.dump(data_dic, default_flow_style=False, # 风格之类的,以最简单的方式显示就行了 indent=4, encoding='utf-8', # 设置编码 allow_unicode=True # 不是转化成unnicode形式 ) with open("rrr","wt", encoding="utf-8") as f: f.write(str(data_bytes, encoding="utf-8"))
haslib
import hashlib m = hashlib.md5() m.update(b"Hello") m.update(b"It's me") print(m.digest()) m.update(b"It's been a long time since last time we ...") print(m.digest()) #2进制格式hash print(len(m.hexdigest())) #16进制格式hash m = hashlib.md5() m.update(bytes('asd',encoding='utf-8')) print(m.hexdigest())
struct 数据打包解包
d=40 struct.pack('i',b) # 打包 b'(\x00\x00\x00' s = struct.pack('i',b) struct.unpack('i',s) # 解包 (40,)
base64
import base64 import StringIO a = "this is a test" b = base64.encodestring(a) # 对字符串编码 print b print base64.decodestring(b) # 对字符串解码 c = StringIO.StringIO() c.write(a) d = StringIO.StringIO() e = StringIO.StringIO() c.seek(0) base64.encode(c, d) # 对StringIO内的数据进行编码 print d.getvalue() d.seek(0) base64.decode(d, e) # 对StringIO内的数据进行解码 print e.getvalue() a = "this is a +test" b = base64.urlsafe_b64encode(a) # 进行url的字符串编码 print b print base64.urlsafe_b64decode(b) 上面的encode函数和decode函数的参数也可以是文件对象: f1 = open('aaa.txt', 'r') f2 = open('bbb.txt', 'w') base64.encode(f1, f2) f1.close() f2.close()
sched
定时任务
import time, os, sched schedule = sched.scheduler(time.time, time.sleep) #schedule.enter(延迟, 优先级, 回调函数, (参数1, 参数2)) def perform_command(cmd, inc): # 安排inc秒后再次运行自己,即周期运行 schedule.enter(inc, 0, perform_command, (cmd, inc)) os.system(cmd) def timming_exe(cmd, inc=60): # enter用来安排某事件的发生时间,从现在起第 10 秒开始启动 schedule.enter(10, 0, perform_command, (cmd, inc)) # 持续运行,直到计划时间队列变成空为止 schedule.run() print("show time after 10 seconds:") timming_exe("echo %time%", 2)