常用模块
1、time和datatime
1 #_*_coding:utf-8_*_ 2 __author__ = 'Alex Li' 3 4 import time 5 6 7 # print(time.clock()) #返回处理器时间,3.3开始已废弃 , 改成了time.process_time()测量处理器运算时间,不包括sleep时间,不稳定,mac上测不出来 8 # print(time.altzone) #返回与utc时间的时间差,以秒计算\ 9 # print(time.asctime()) #返回时间格式"Fri Aug 19 11:14:16 2016", 10 # print(time.localtime()) #返回本地时间 的struct time对象格式 11 # print(time.gmtime(time.time()-800000)) #返回utc时间的struc时间对象格式 12 13 # print(time.asctime(time.localtime())) #返回时间格式"Fri Aug 19 11:14:16 2016", 14 #print(time.ctime()) #返回Fri Aug 19 12:38:29 2016 格式, 同上 15 16 17 18 # 日期字符串 转成 时间戳 19 # string_2_struct = time.strptime("2016/05/22","%Y/%m/%d") #将 日期字符串 转成 struct时间对象格式 20 # print(string_2_struct) 21 # # 22 # struct_2_stamp = time.mktime(string_2_struct) #将struct时间对象转成时间戳 23 # print(struct_2_stamp) 24 25 26 27 #将时间戳转为字符串格式 28 # print(time.gmtime(time.time()-86640)) #将utc时间戳转换成struct_time格式 29 # print(time.strftime("%Y-%m-%d %H:%M:%S",time.gmtime()) ) #将utc struct_time格式转成指定的字符串格式 30 31 32 33 34 35 #时间加减 36 import datetime 37 38 # print(datetime.datetime.now()) #返回 2016-08-19 12:47:03.941925 39 #print(datetime.date.fromtimestamp(time.time()) ) # 时间戳直接转成日期格式 2016-08-19 40 # print(datetime.datetime.now() ) 41 # print(datetime.datetime.now() + datetime.timedelta(3)) #当前时间+3天 42 # print(datetime.datetime.now() + datetime.timedelta(-3)) #当前时间-3天 43 # print(datetime.datetime.now() + datetime.timedelta(hours=3)) #当前时间+3小时 44 # print(datetime.datetime.now() + datetime.timedelta(minutes=30)) #当前时间+30分 45 46 47 # 48 # c_time = datetime.datetime.now() 49 # print(c_time.replace(minute=3,hour=2)) #时间替换
2、subprocess
http://hackerxu.com/2014/10/09/subprocess.html
3、正则表达式:
re 模块提供正则表达式匹配操作
常用正则表达式符号:
'.' 匹配任意字符,除了'\n' 换行符,如果设定了DOTALL flag,则匹配任意的字符包含\n 换行符
re.findall(r'.',"sdsdsds\ndsds\3232",re.DOTALL)
'^' 匹配以特定字符开头,如果是在'MULTILINE'模式下,则可以进行换行匹配,所有行只要开头满足要求的都算匹配, 如果不指定MULTILINE,默认把待匹配的字符串当'单行'看待,不支持换行匹配
例如:
re.search(r"^a","\nabc\naee",re.MULTILINE).group() 将得到匹配,而去掉多行模式,则匹配失败,re.search(r"^a","\nabc\naee"),这时它会认为目标字符串是以\n开的
'$' 在默认模式下, 匹配以特定字符结尾或者\n前以特定字符结尾。
例如,在默认模式下,
re.findall(r"foo.$",'foo1\nfoo2\n').group() #匹配结果是["foo2"] ,默认是不区分多行,当成了一个整体进行匹配,忽略多行,所有匹配结果是foo2,因为'foo1\nfoo2\n'是以foo2结尾的。
而在MULTILINE 模式下,
re.findall(r"foo.$",'foo1\nfoo2\n',re.MULTILINE).group() # 匹配结果是['foo1', 'foo2'],多行模式下,进行逐行进行匹配,'foo1\nfoo2\n' 有3行,第一行的foo1和第二行的foo2都满足要求
'*' 重复*前特定字符0次到无限次,ab* 将匹配 "a后面紧跟着任意多个b" 例如 re.findall('ab*','acab2abbb445abbbbbb') 的结果是 ['a', 'ab', 'abbb', 'abbbbbb']
'+' 重复+前特定字符1次到无限次,ab+ 将匹配 "a后面紧跟着至少1个b" 例如 re.findall('ab+','acab2abbb445abbbbbb') 的结果是 ['ab', 'abbb', 'abbbbbb']
'?' 重复?前特定字符0次或者1次,ab? 将匹配'a后面紧跟着0个b或者1个b,例如 re.findall('ab?','acab2abbb445abbbbbb') 的结果是 ['a', 'ab', 'ab', 'ab']*?
,+?
,?? 在'*','+','?' 后面加上?,将设置为非贪婪模式,匹配尽可能最少的字符串
{m} 重复{m}前特定字符m次, ab{m} 将匹配'a后面紧跟着m个b,例如 re.findall('ab{3}','acab2abbb445abbbbbb') 的结果是 ['abbbbb']
{m,n} 重复{m,n}前特定字符m次到n次, ab{m,n}将匹配'a后面紧跟着m到n个b',例如re.findall('ab{3,5}','acab2abbb445abababbbbbb') 的结果是 ['abbb', 'abbbbb'],而如果不设置n,这表示至少重复m次,re.findall('ab{1,}','acab2abbb445abababbbbbb')的结果是 ['ab', 'abbb', 'ab', 'ab', 'abbbbbb']
'\' 转义符,转义一些特殊符号的特殊含义
[] 放在在[]中字符都将得到匹配, 例如 re.findall('[abc]','adsdsvcdsdsdsb')结果是['a', 'c', 'b']
'|' 匹配'|' 中2边的字符,例如re.findall('ad|c','adsdsvcdsdsdsb')结果是['ad', 'c'],'|’在[]中自动变成普通字符串,没有特殊含义
() 用多个字符放在()中作为一个整体然后加上正则表达式符号匹配,例如.search(
"(abc){2}a(123|456)c"
,
"abcabca456c"
).group() 结果 abcabca456c,和research一起使用
'(?P<name>...)'
分组匹配 re.search(
"(?P<province>[0-9]{4})(?P<city>[0-9]{2})(?P<birthday>[0-9]{4})"
,
"371481199306143242"
).groupdict(
"city"
) 结果{
'province'
:
'3714'
,
'city'
:
'81'
,
'birthday'
:
'1993'
}
'\A' 从开头开始匹配字符 re.search('\A1b1','1b1fdfd').group() 结果'1b1'
'\d' 等同[0-9]
'\D' 非数字,等同 [^0-9]
'\s' 匹配任何空格 [\t\n\r\f\v]
'\S' 匹配任何非空格 [^\t\n\r\f\v]
'\w' 匹配字母数字[A-Za-z0-9]
'\W' 匹配非字母数字[^A-Za-z0-9]
'\Z' 匹配以特定字符结尾 等同'$'
re 模块常用方法
re.compile
使用方法
import re
obj = re.compile('\d') # 编译一个匹配正则表达式为一个正则表达式对象,该对象可以使用match() 和search() 方法
resutl = obj.match('1abcdwe3')
其实上面这2句等同于 result = re.match('\d','1abcdwe3')
那什么时候使用re.compile 呢,如果以一段程序中,我们经常要使用某个表达式进行很多次匹配时,可以使用它,因为他只需编译一次,不需每次匹配都去编译,提高了程序的效率
re.match 与re.search
re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配,匹配到一个就返回,不找出所有的匹配
re.split() # 将匹配到的格式当做分割点对字符串分割成列表
例如
>>>m = re.split("[0-9]", "alex1rain2jack3helen rachel8") >>>print(m) ['alex', 'rain', 'jack', 'helen rachel', '']
re.findall() # 找到所有要匹配的字符并返回列表格式
>>>m = re.findall("[0-9]", "alex1rain2jack3helen rachel8") >>>print(m)
['1', '2', '3', '8']
re.sub(pattern, repl, string, count,flag) # 替换匹配到的字符
m=re.sub("[0-9]","|", "alex1rain2jack3helen rachel8",count=2 ) print(m) alex|rain|jack3helen rachel8
3、logging
很多程序都有记录日志的需求,并且日志中包含的信息即有正常的程序访问日志,还可能有错误、警告等信息输出,python的logging模块提供了标准的日志接口,你可以通过它存储各种格式的日志,logging的日志可以分为 debug()
, info()
, warning()
, error()
and critical() 5个级别,
下面我们看一下怎么用。
最简单用法
1
2
3
4
5
6
7
8
|
import logging logging.warning( "user [alex] attempted wrong password more than 3 times" ) logging.critical( "server is down" ) #输出 WARNING:root:user [alex] attempted wrong password more than 3 times CRITICAL:root:server is down |
看一下这几个日志级别分别代表什么意思
Level | When it’s used |
---|---|
DEBUG |
Detailed information, typically of interest only when diagnosing problems. |
INFO |
Confirmation that things are working as expected. |
WARNING |
An indication that something unexpected happened, or indicative of some problem in the near future (e.g. ‘disk space low’). The software is still working as expected. |
ERROR |
Due to a more serious problem, the software has not been able to perform some function. |
CRITICAL |
A serious error, indicating that the program itself may be unable to continue running. |
如果想把日志写到文件里,也很简单
1
2
3
4
5
6
|
import logging logging.basicConfig(filename = 'example.log' ,level = logging.INFO) logging.debug( 'This message should go to the log file' ) logging.info( 'So should this' ) logging.warning( 'And this, too' ) |
其中下面这句中的level=loggin.INFO意思是,把日志纪录级别设置为INFO,也就是说,只有比日志是INFO或比INFO级别更高的日志才会被纪录到文件里,在这个例子, 第一条日志是不会被纪录的,如果希望纪录debug的日志,那把日志级别改成DEBUG就行了。
1
|
logging.basicConfig(filename = 'example.log' ,level = logging.DEBUG) |
感觉上面的日志格式忘记加上时间啦,日志不知道时间怎么行呢,下面就来加上!
1
2
3
4
5
6
|
import logging logging.basicConfig( format = '%(asctime)s %(message)s' , datefmt = '%m/%d/%Y %I:%M:%S %p' ) logging.warning( 'is when this event was logged.' ) #输出 12 / 12 / 2010 11 : 46 : 36 AM is when this event was logged. |
日志格式
%(name)s |
Logger的名字 |
%(levelno)s |
数字形式的日志级别 |
%(levelname)s |
文本形式的日志级别 |
%(pathname)s |
调用日志输出函数的模块的完整路径名,可能没有 |
%(filename)s |
调用日志输出函数的模块的文件名 |
%(module)s |
调用日志输出函数的模块名 |
%(funcName)s |
调用日志输出函数的函数名 |
%(lineno)d |
调用日志输出函数的语句所在的代码行 |
%(created)f |
当前时间,用UNIX标准的表示时间的浮 点数表示 |
%(relativeCreated)d |
输出日志信息时的,自Logger创建以 来的毫秒数 |
%(asctime)s |
字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒 |
%(thread)d |
线程ID。可能没有 |
%(threadName)s |
线程名。可能没有 |
%(process)d |
进程ID。可能没有 |
%(message)s |
用户输出的消息 |
如果想同时把log打印在屏幕和文件日志里,就需要了解一点复杂的知识 了
Python 使用logging模块记录日志涉及四个主要类,使用官方文档中的概括最为合适:
logger提供了应用程序可以直接使用的接口;
handler将(logger创建的)日志记录发送到合适的目的输出;
filter提供了细度设备来决定输出哪条日志记录;
formatter决定日志记录的最终输出格式。
logger
每个程序在输出信息之前都要获得一个Logger。Logger通常对应了程序的模块名,比如聊天工具的图形界面模块可以这样获得它的Logger:
LOG=logging.getLogger(”chat.gui”)
而核心模块可以这样:
LOG=logging.getLogger(”chat.kernel”)
Logger.setLevel(lel):指定最低的日志级别,低于lel的级别将被忽略。debug是最低的内置级别,critical为最高
Logger.addFilter(filt)、Logger.removeFilter(filt):添加或删除指定的filter
Logger.addHandler(hdlr)、Logger.removeHandler(hdlr):增加或删除指定的handler
Logger.debug()、Logger.info()、Logger.warning()、Logger.error()、Logger.critical():可以设置的日志级别
handler
handler对象负责发送相关的信息到指定目的地。Python的日志系统有多种Handler可以使用。有些Handler可以把信息输出到控制台,有些Logger可以把信息输出到文件,还有些 Handler可以把信息发送到网络上。如果觉得不够用,还可以编写自己的Handler。可以通过addHandler()方法添加多个多handler
Handler.setLevel(lel):指定被处理的信息级别,低于lel级别的信息将被忽略
Handler.setFormatter():给这个handler选择一个格式
Handler.addFilter(filt)、Handler.removeFilter(filt):新增或删除一个filter对象
每个Logger可以附加多个Handler。接下来我们就来介绍一些常用的Handler:
1) logging.StreamHandler
使用这个Handler可以向类似与sys.stdout或者sys.stderr的任何文件对象(file object)输出信息。它的构造函数是:
StreamHandler([strm])
其中strm参数是一个文件对象。默认是sys.stderr
2) logging.FileHandler
和StreamHandler类似,用于向一个文件输出日志信息。不过FileHandler会帮你打开这个文件。它的构造函数是:
FileHandler(filename[,mode])
filename是文件名,必须指定一个文件名。
mode是文件的打开方式。参见Python内置函数open()的用法。默认是’a',即添加到文件末尾。
3) logging.handlers.RotatingFileHandler
这个Handler类似于上面的FileHandler,但是它可以管理文件大小。当文件达到一定大小之后,它会自动将当前日志文件改名,然后创建 一个新的同名日志文件继续输出。比如日志文件是chat.log。当chat.log达到指定的大小之后,RotatingFileHandler自动把 文件改名为chat.log.1。不过,如果chat.log.1已经存在,会先把chat.log.1重命名为chat.log.2。。。最后重新创建 chat.log,继续输出日志信息。它的构造函数是:
RotatingFileHandler( filename[, mode[, maxBytes[, backupCount]]])
其中filename和mode两个参数和FileHandler一样。
maxBytes用于指定日志文件的最大文件大小。如果maxBytes为0,意味着日志文件可以无限大,这时上面描述的重命名过程就不会发生。
backupCount用于指定保留的备份文件的个数。比如,如果指定为2,当上面描述的重命名过程发生时,原有的chat.log.2并不会被更名,而是被删除。
4) logging.handlers.TimedRotatingFileHandler
这个Handler和RotatingFileHandler类似,不过,它没有通过判断文件大小来决定何时重新创建日志文件,而是间隔一定时间就 自动创建新的日志文件。重命名的过程与RotatingFileHandler类似,不过新的文件不是附加数字,而是当前时间。它的构造函数是:
TimedRotatingFileHandler( filename [,when [,interval [,backupCount]]])
其中filename参数和backupCount参数和RotatingFileHandler具有相同的意义。
interval是时间间隔。
when参数是一个字符串。表示时间间隔的单位,不区分大小写。它有以下取值:
S 秒
M 分
H 小时
D 天
W 每星期(interval==0时代表星期一)
midnight 每天凌晨
example 1:
import logging #create logger logger = logging.getLogger('TEST-LOG') logger.setLevel(logging.DEBUG) # create console handler and set level to debug ch = logging.StreamHandler() ch.setLevel(logging.DEBUG) # create file handler and set level to warning fh = logging.FileHandler("access.log") fh.setLevel(logging.WARNING) # create formatter formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s') # add formatter to ch and fh ch.setFormatter(formatter) fh.setFormatter(formatter) # add ch and fh to logger logger.addHandler(ch) logger.addHandler(fh) # 'application' code logger.debug('debug message') logger.info('info message') logger.warn('warn message') logger.error('error message') logger.critical('critical message')
example 2
import logging from logging import handlers logger = logging.getLogger(__name__) log_file = "timelog.log" #fh = handlers.RotatingFileHandler(filename=log_file,maxBytes=10,backupCount=3) fh = handlers.TimedRotatingFileHandler(filename=log_file,when="S",interval=5,backupCount=3) formatter = logging.Formatter('%(asctime)s %(module)s:%(lineno)d %(message)s') fh.setFormatter(formatter) logger.addHandler(fh) logger.warning("test1") logger.warning("test12") logger.warning("test13") logger.warning("test14")