logging/re - 总结
logging 模块
很多程序都有记录日志的需求
logging的日志可以分为 debug(), info(), warning(), error() and critical()5个级别
1.输出到屏幕上
import logging #输出到屏幕上 只显示 warning error critical 不会显示 debug info logging.debug('user wrong 3 times') logging.info('user wrong 3 times') logging.warning('user wrong 3 times') logging.error('user wrong 3 times') logging.critical('user wrong 3 times')
2.输出到文件中
import logging #输出到文件中 显示 >= level(ERROR) 若是不设level 不会显示 debug info logging.basicConfig(filename='logmsg.log',level=logging.ERROR) logging.debug('user wrong 3 times') logging.info('user wrong 3 times') logging.warning('user wrong 3 times') logging.error('user wrong 3 times') logging.critical('user wrong 3 times')
3.输出日期格式
import logging logging.basicConfig(filename='logmsg.log', format='%(asctime)s - %(levelno)s - %(levelname)s - %(filename)s - %(message)s', datefmt='%m/%d/%Y %I:%M:%S %p', level=logging.DEBUG) # logging.basicConfig(format='%(asctime)s %(message)s',datefmt='%Y-%m-%d %I:%M:%S %p',level=logging.DEBUG) logging.debug('user wrong 3 times') logging.info('user wrong 3 times') logging.warning('user wrong 3 times') logging.error('user wrong 3 times') logging.critical('user wrong 3 times') 除了加时间,还可以自定义一大堆格式,下表就是所有支持的格式 %(name)s Logger的名字 %(levelno)s 数字形式的日志级别 %(levelname)s 文本形式的日志级别 %(pathname)s 调用日志输出函数的模块的完整路径名,可能没有 会乱码 %(filename)s 调用日志输出函数的模块的文件名 %(module)s 调用日志输出函数的模块名 %(funcName)s 调用日志输出函数的函数名 %(lineno)d 调用日志输出函数的语句所在的代码行 %(created)f 当前时间,用UNIX标准的表示时间的浮点数表示 %(relativeCreated)d 输出日志信息时的,自Logger创建以 来的毫秒数 %(asctime)s 字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒 %(thread)d 线程ID。可能没有 %(threadName)s 线程名。可能没有 %(process)d 进程ID。可能没有 %(message)s 用户输出的消息
4.同时输出到屏幕和文件中:四个组件,类:logger handler filter formatter
1 import logging 2 from logging import handlers 3 4 class IgnoreBackupLogFilter(logging.Filter): 5 """忽略带db backup 的日志""" 6 def filter(self, record): #固定写法 7 return "db backup" not in record.getMessage() #如果是True就记录 8 9 # 1.生成logger对象 10 logger= logging.getLogger('web') 11 logger.setLevel(logging.DEBUG) 12 13 #1.1 把filter对象添加到logger中 14 logger.addFilter(IgnoreBackupLogFilter()) 15 16 #2.生成handler对象 17 ch = logging.StreamHandler() 18 # ch.setLevel(logging.INFO) 19 # fh = logging.FileHandler('lweb.log') 20 # RotatingFileHandler( filename[, mode[, maxBytes[, backupCount]]]) 按文件大小截断 21 # fh = handlers.RotatingFileHandler('lweb.log',maxBytes=10,backupCount=3) 22 # TimedRotatingFileHandler( filename [,when [,interval [,backupCount]]]) 按时间截断 23 fh = handlers.TimedRotatingFileHandler('lweb.log',when='S',interval=5,backupCount=3) 24 # fh.setLevel(logging.WARNING) 25 26 #2.1把handler对象绑定到logger 27 logger.addHandler(ch) 28 logger.addHandler(fh) 29 30 #3.生成formatter对象 31 #3.1把formatter对象绑定到handler对象 32 file_formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s', datefmt='%m/%d/%Y %I:%M:%S %p') 33 console_formatter = logging.Formatter('%(asctime)s - %(name)s - %(lineno)s - %(message)s', datefmt='%Y-%m-%d %H:%M:%S %p') 34 ch.setFormatter(console_formatter) 35 fh.setFormatter(file_formatter) 36 37 logger.debug('user db backup wrong 3 times') 38 logger.info('user wrong 3 times') 39 logger.warning('user wrong 3 times') 40 logger.error('user db backup wrong 3 times') 41 logger.critical('user db backup wrong 3 times') 42 43 # 没有给级别 之前 默认是 warning 44 #handler的级别不能比全局低 45 #像是一个漏斗 全局过滤之后 才到handler 46 #全局设置为DEBUG后 console handler 设置为 INFO ,如果输出的日志级别为debug,那就不会在屏幕上打印
#注意: maxBytes用于指定日志文件的最大文件大小 backupCount用于指定保留的备份文件的个数 when参数是一个字符串 S秒 M分 H小时 D天 W每星期(interval==0时 代表星期一) midnight 每天凌晨 interval是时间间隔
-------------------------------------------------------------------------------
re 模块
正则表达式:字符串的匹配规则
1.re常见的匹配语法有以下几种
re.match 从头开始匹配 只匹配一个就返回 场景:手机号 re.search 全局匹配 只匹配一个就返回 re.findall 把所有匹配到的字符放到以列表中的元素返回 phones = re.findall('1[0-9]{10}', data) re.split 以匹配到的字符当做列表分隔符 re.sub 匹配字符并替换 re.fullmatch 全部匹配 re.match('[0-9]','123dasd') = <_sre.SRE_Match object; span=(0, 1), match='1'> re.search('[0-9]','abc1d3e') = <_sre.SRE_Match object; span=(3, 4), match='1'> # re.findall('[0-9]','abc1d3e') = ['1', '3']
注: match 和 search 返回是一个对象 是这样拿值的:需要先判断 否则会报错 res = re.search('[0-9]','abs1d2') if res: print(res.group()) re.match('sd','sd*sda') == re.search('^sd','sd*sda') == re.search('\Asd','sd*sda') == sd re.search('sd$','adssasd') == re.search('sd\Z','adssasd') == sd re.search('[0-9]','alex23') == re.search('\d','alex23') == 2
2.示例:
re.search('.','*a2a3sdas') == * #任意一个字符 re.search('^sd','sd*sda') == sd #以什么开头 re.search('sd$','sdasd') == sd #以什么结尾 re.match('b$','b') == b #只匹配一个 re.search('ab*','abblex') == abb #*前一个字符0次或多次 re.search('ab*','sdad') == a re.search('ab+','sdad') == None re.search('ab+','sdabbbd') == abbb re.search('a+','sdaa') == aa #+前一个字符1次或多次 re.search('.+','abcd') == abcd #匹配到所有 re.search('a?','aasad') == a #?前一个字符0次或1次 re.search('a{2}','dddaa') == aa #{m}前一个字符m次 re.search('[0-9]','asd232') == 2 #[] 匹配0-9一次 [a-z] re.search('[a-z]{1,5}','2lex') == lex #{n,m}匹配前一个字符n到m次 re.search('[a|A]lex','alex') == alex #|或 匹配左或右的字符 re.search('([a-z]+)([0-9]+)','alex123').groups() == ('alex', '123') #()()分组匹配 re.search('\Aalex','alex') == alex #\A以什么开头 re.search('sd\Z','adssasd') == sd #\Z以什么结尾 re.search('\d','alex23') == 2 #\d匹配数字0-9 re.search('\d+','alex23') == 23 re.search('\D','alex23') == a #匹配非数字 re.search('\D+','@*&234alex23') == @*& re.search('\w+','!@#23saAS') == 23saAS #匹配[A-Z a-z 0-9] re.search('\W+','!$@23saAS') == !$@ #匹配非[A-Z a-z 0-9] 即:特殊字符 re.findall('\s','alex\njack\rma ck\tjack') == ['\n', '\r', ' ', '\t'] #匹配空白字符 \n \r \t s='61062019991011053' #分组,可定义成字典 re.search('(?P<province>\d{3})(?P<city>\d{3})(?P<born_year>\d{4})',s).groups() == ('610', '620', '1999') re.search('(?P<province>\d{3})(?P<city>\d{3})(?P<born_year>\d{4})',s).groupdict() == {'province': '610', 'city': '620', 'born_year': '1999'}
3.常用的表达式规则
'.' 默认匹配除\n之外的任意一个字符,若指定flag DOTALL,(re.S)则匹配任意字符,包括换行 '^' 匹配字符开头,若指定flags MULTILINE,(re.M)这种也可以匹配上(r"^a","\nabc\neee",flags=re.MULTILINE) '$' 匹配字符结尾, 若指定flags MULTILINE(re.M) ,re.search('foo.$','foo1\nfoo2\n',re.MULTILINE).group() 会匹配到foo1 '*' 匹配*号前的字符0次或多次, re.search('a*','aaaabac') 结果'aaaa' '+' 匹配前一个字符1次或多次,re.findall("ab+","ab+cd+abb+bba") 结果['ab', 'abb'] '?' 匹配前一个字符1次或0次 ,re.search('b?','alex').group() 匹配b 0次 '{m}' 匹配前一个字符m次 ,re.search('b{3}','alexbbbs').group() 匹配到'bbb' '{n,m}' 匹配前一个字符n到m次,re.findall("ab{1,3}","abb abc abbcbbb") 结果'abb', 'ab', 'abb'] '|' 匹配|左或|右的字符,re.search("abc|ABC","ABCBabcCD").group() 结果'ABC' '(...)' 分组匹配, re.search("(abc){2}a(123|45)", "abcabca456c").group() 结果为'abcabca45' '\A' 只从字符开头匹配,re.search("\Aabc","alexabc") 是匹配不到的,相当于re.match('abc',"alexabc") 或^ '\Z' 匹配字符结尾,同$ '\d' 匹配数字0-9 '\D' 匹配非数字 '\w' 匹配[A-Za-z0-9] '\W' 匹配非[A-Za-z0-9] '\s' 匹配空白字符、\t、\n、\r , re.search("\s+","ab\tc1\n3").group() 结果 '\t' '(?P<name>...)' 分组匹配 re.search("(?P<province>[0-9]{4})(?P<city>[0-9]{2})(?P<birthday>[0-9]{4})","371481199306143242").groupdict("city") 结果{'province': '3714', 'city': '81', 'birthday': '1993'}
4.分割:re.split() 替换:re.sub() 全部匹配:re.fullmatch() 全部匹配:pattern = re.compile() pattern.fullmatch() 效率高
s='alex22jack23jinxin50|mack-oldboy' re.split('\d+|\||-',s) == ['alex', 'jack', 'jinxin', '', 'mack', 'oldboy'] re.findall('\d+|\||-',s) = ['22', '23', '50', '|', '-'] s='alex22jack23jinxin50\mack-oldboy' re.split('\\\\',s) == ['alex22jack23jinxin50', 'mack-oldboy'] s='9-2*5/3+7/3*99/4*2998+10*568/14' re.split('\W+',s) == ['9', '2', '5', '3', '7', '3', '99', '4', '2998', '10', '568', '14'] re.split('\W+',s,maxsplit=3) == ['9', '2', '5', '3+7/3*99/4*2998+10*568/14'] re.split('[-\*/\+]',s) == ['9', '2', '5', '3', '7', '3', '99', '4', '2998', '10', '568', '14'] s = 'alex22jack23jinxin50\\mack-oldboy' re.sub('\d+','_',s) == 'alex_jack_jinxin_\\mack-oldboy' re.sub('\d+','_',s,count=2) == 'alex_jack_jinxin50\\mack-oldboy' re.fullmatch('\w+@\w+\.(com|cn|edu)','alex@oldboyedu.com') # 慢 规则需要转换成bytes需时间 pattern = re.compile('\w+@\w+\.(com|cn|edu)') #快 规则转换bytes1次就可以了 pattern.fullmatch('alex@oldboyedu.com') == <_sre.SRE_Match object; span=(0, 18), match='alex@oldboyedu.com'>
5.标识符 Flags
re.I #忽略大小写 re.IGNORECASE re.M #多行模式 re.MULTILINE re.S #改变.的行为,.是任意字符,除了换行符\n re.DOTALL re.X #可对正则 规则 注释 re.VERBOSE re.search('a','Alex',re.I) == A re.search('foo.$','foo1\nfoo2\n') == foo2 re.search('foo.$','foo1\nfoo2\n',re.M) == foo1 re.search('^s','\nsds',re.M) == s re.search('.','\n') == None re.search('.','\n',re.S) == \n re.search('.','alex') == a re.search('. #test','alex') == None re.search('. #test','alex',re.X) = a
注:
[^"] 表示不包含“这个字符
[^()] 表示不包含()这个括号
re.search(r'\\','asd2\sad') == <_sre.SRE_Match object; span=(4, 5), match='\\'>
re.search('\\\\','asd2\sad') == <_sre.SRE_Match object; span=(4, 5), match='\\'>
r:表示原生字符串