常用模块

1、time和datatime

 1 #_*_coding:utf-8_*_
 2 __author__ = 'Alex Li'
 3 
 4 import time
 5 
 6 
 7 # print(time.clock()) #返回处理器时间,3.3开始已废弃 , 改成了time.process_time()测量处理器运算时间,不包括sleep时间,不稳定,mac上测不出来
 8 # print(time.altzone)  #返回与utc时间的时间差,以秒计算\
 9 # print(time.asctime()) #返回时间格式"Fri Aug 19 11:14:16 2016",
10 # print(time.localtime()) #返回本地时间 的struct time对象格式
11 # print(time.gmtime(time.time()-800000)) #返回utc时间的struc时间对象格式
12 
13 # print(time.asctime(time.localtime())) #返回时间格式"Fri Aug 19 11:14:16 2016",
14 #print(time.ctime()) #返回Fri Aug 19 12:38:29 2016 格式, 同上
15 
16 
17 
18 # 日期字符串 转成  时间戳
19 # string_2_struct = time.strptime("2016/05/22","%Y/%m/%d") #将 日期字符串 转成 struct时间对象格式
20 # print(string_2_struct)
21 # #
22 # struct_2_stamp = time.mktime(string_2_struct) #将struct时间对象转成时间戳
23 # print(struct_2_stamp)
24 
25 
26 
27 #将时间戳转为字符串格式
28 # print(time.gmtime(time.time()-86640)) #将utc时间戳转换成struct_time格式
29 # print(time.strftime("%Y-%m-%d %H:%M:%S",time.gmtime()) ) #将utc struct_time格式转成指定的字符串格式
30 
31 
32 
33 
34 
35 #时间加减
36 import datetime
37 
38 # print(datetime.datetime.now()) #返回 2016-08-19 12:47:03.941925
39 #print(datetime.date.fromtimestamp(time.time()) )  # 时间戳直接转成日期格式 2016-08-19
40 # print(datetime.datetime.now() )
41 # print(datetime.datetime.now() + datetime.timedelta(3)) #当前时间+3天
42 # print(datetime.datetime.now() + datetime.timedelta(-3)) #当前时间-3天
43 # print(datetime.datetime.now() + datetime.timedelta(hours=3)) #当前时间+3小时
44 # print(datetime.datetime.now() + datetime.timedelta(minutes=30)) #当前时间+30分
45 
46 
47 #
48 # c_time  = datetime.datetime.now()
49 # print(c_time.replace(minute=3,hour=2)) #时间替换

2、subprocess

http://hackerxu.com/2014/10/09/subprocess.html

3、正则表达式：

re 模块提供正则表达式匹配操作

常用正则表达式符号：

'.'     匹配任意字符，除了'\n' 换行符,如果设定了DOTALL flag，则匹配任意的字符包含\n 换行符

re.findall(r'.',"sdsdsds\ndsds\3232",re.DOTALL)

'^'     匹配以特定字符开头，如果是在'MULTILINE'模式下，则可以进行换行匹配，所有行只要开头满足要求的都算匹配， 如果不指定MULTILINE，默认把待匹配的字符串当'单行'看待，不支持换行匹配

例如：
re.search(r"^a","\nabc\naee",re.MULTILINE).group() 将得到匹配，而去掉多行模式，则匹配失败，re.search(r"^a","\nabc\naee")，这时它会认为目标字符串是以\n开的


'$'   在默认模式下， 匹配以特定字符结尾或者\n前以特定字符结尾。


例如，在默认模式下，

re.findall(r"foo.$",'foo1\nfoo2\n').group()    #匹配结果是["foo2"] ,默认是不区分多行，当成了一个整体进行匹配，忽略多行，所有匹配结果是foo2，因为'foo1\nfoo2\n'是以foo2结尾的。



而在MULTILINE 模式下，
re.findall(r"foo.$",'foo1\nfoo2\n',re.MULTILINE).group()  # 匹配结果是['foo1', 'foo2']，多行模式下，进行逐行进行匹配，'foo1\nfoo2\n' 有3行，第一行的foo1和第二行的foo2都满足要求


'*'  重复*前特定字符0次到无限次，ab* 将匹配 "a后面紧跟着任意多个b" 例如 re.findall('ab*','acab2abbb445abbbbbb') 的结果是 ['a', 'ab', 'abbb', 'abbbbbb']

'+'  重复+前特定字符1次到无限次，ab+ 将匹配 "a后面紧跟着至少1个b" 例如 re.findall('ab+','acab2abbb445abbbbbb') 的结果是 ['ab', 'abbb', 'abbbbbb']

'?' 重复?前特定字符0次或者1次，ab? 将匹配'a后面紧跟着0个b或者1个b,例如 re.findall('ab?','acab2abbb445abbbbbb') 的结果是 ['a', 'ab', 'ab', 'ab']


*?, +?, ??  在'*','+','?' 后面加上?,将设置为非贪婪模式，匹配尽可能最少的字符串

{m} 重复{m}前特定字符m次， ab{m} 将匹配'a后面紧跟着m个b，例如 re.findall('ab{3}','acab2abbb445abbbbbb') 的结果是 ['abbbbb']

{m,n} 重复{m,n}前特定字符m次到n次， ab{m,n}将匹配'a后面紧跟着m到n个b'，例如re.findall('ab{3,5}','acab2abbb445abababbbbbb') 的结果是 ['abbb', 'abbbbb']，而如果不设置n，这表示至少重复m次，re.findall('ab{1,}','acab2abbb445abababbbbbb')的结果是 ['ab', 'abbb', 'ab', 'ab', 'abbbbbb']

'\'  转义符，转义一些特殊符号的特殊含义

[]  放在在[]中字符都将得到匹配， 例如  re.findall('[abc]','adsdsvcdsdsdsb')结果是['a', 'c', 'b']

'|'  匹配'|' 中2边的字符，例如re.findall('ad|c','adsdsvcdsdsdsb')结果是['ad', 'c']，'|’在[]中自动变成普通字符串，没有特殊含义

()  用多个字符放在()中作为一个整体然后加上正则表达式符号匹配，例如 .search("(abc){2}a(123|456)c", "abcabca456c").group() 结果 abcabca456c，和research一起使用

'(?P<name>...)'  分组匹配 re.search("(?P<province>[0-9]{4})(?P<city>[0-9]{2})(?P<birthday>[0-9]{4})","371481199306143242").groupdict("city") 结果{'province': '3714', 'city': '81', 'birthday': '1993'}


'\A'  从开头开始匹配字符  re.search('\A1b1','1b1fdfd').group()   结果'1b1'

'\d' 等同[0-9]

'\D' 非数字，等同 [^0-9]

'\s'  匹配任何空格 [\t\n\r\f\v]

'\S' 匹配任何非空格 [^\t\n\r\f\v]

'\w'  匹配字母数字[A-Za-z0-9]

'\W'  匹配非字母数字[^A-Za-z0-9]

'\Z' 匹配以特定字符结尾 等同'$' 




re 模块常用方法



re.compile

使用方法

import re

obj = re.compile('\d')     # 编译一个匹配正则表达式为一个正则表达式对象，该对象可以使用match() 和search() 方法

resutl = obj.match('1abcdwe3')


其实上面这2句等同于 result = re.match('\d','1abcdwe3')

那什么时候使用re.compile 呢，如果以一段程序中，我们经常要使用某个表达式进行很多次匹配时，可以使用它，因为他只需编译一次，不需每次匹配都去编译，提高了程序的效率

re.match 与re.search

re.match只匹配字符串的开始，如果字符串开始不符合正则表达式，则匹配失败，函数返回None；而re.search匹配整个字符串，直到找到一个匹配,匹配到一个就返回，不找出所有的匹配

re.split()　　　　　　　　　　　　# 将匹配到的格式当做分割点对字符串分割成列表

例如

>>>m = re.split("[0-9]", "alex1rain2jack3helen rachel8")
>>>print(m)

['alex', 'rain', 'jack', 'helen rachel', '']

re.findall()　　　　　　　　　　# 找到所有要匹配的字符并返回列表格式

>>>m = re.findall("[0-9]", "alex1rain2jack3helen rachel8")
>>>print(m)

['1', '2', '3', '8']

re.sub(pattern, repl, string, count,flag) 　　　# 替换匹配到的字符

m=re.sub("[0-9]","|", "alex1rain2jack3helen rachel8",count=2 )
print(m)

alex|rain|jack3helen rachel8

3、logging

很多程序都有记录日志的需求，并且日志中包含的信息即有正常的程序访问日志，还可能有错误、警告等信息输出，python的logging模块提供了标准的日志接口，你可以通过它存储各种格式的日志，logging的日志可以分为 debug(), info(), warning(), error() and critical() 5个级别，下面我们看一下怎么用。

最简单用法

import logging
 
logging.warning("user [alex] attempted wrong password more than 3 times")
logging.critical("server is down")
 
#输出
WARNING:root:user [alex] attempted wrong password more than 3 times
CRITICAL:root:server is down

看一下这几个日志级别分别代表什么意思

Level	When it’s used
`DEBUG`	Detailed information, typically of interest only when diagnosing problems.
`INFO`	Confirmation that things are working as expected.
`WARNING`	An indication that something unexpected happened, or indicative of some problem in the near future (e.g. ‘disk space low’). The software is still working as expected.
`ERROR`	Due to a more serious problem, the software has not been able to perform some function.
`CRITICAL`	A serious error, indicating that the program itself may be unable to continue running.

如果想把日志写到文件里，也很简单

import logging
 
logging.basicConfig(filename='example.log',level=logging.INFO)
logging.debug('This message should go to the log file')
logging.info('So should this')
logging.warning('And this, too')

其中下面这句中的level=loggin.INFO意思是，把日志纪录级别设置为INFO，也就是说，只有比日志是INFO或比INFO级别更高的日志才会被纪录到文件里，在这个例子，第一条日志是不会被纪录的，如果希望纪录debug的日志，那把日志级别改成DEBUG就行了。

logging.basicConfig(filename='example.log',level=logging.DEBUG)

感觉上面的日志格式忘记加上时间啦，日志不知道时间怎么行呢，下面就来加上!

import logging
logging.basicConfig(format='%(asctime)s %(message)s', datefmt='%m/%d/%Y %I:%M:%S %p')
logging.warning('is when this event was logged.')
 
#输出
12/12/2010 11:46:36 AM is when this event was logged.

日志格式

%(name)s	Logger的名字
%(levelno)s	数字形式的日志级别
%(levelname)s	文本形式的日志级别
%(pathname)s	调用日志输出函数的模块的完整路径名，可能没有
%(filename)s	调用日志输出函数的模块的文件名
%(module)s	调用日志输出函数的模块名
%(funcName)s	调用日志输出函数的函数名
%(lineno)d	调用日志输出函数的语句所在的代码行
%(created)f	当前时间，用UNIX标准的表示时间的浮点数表示
%(relativeCreated)d	输出日志信息时的，自Logger创建以来的毫秒数
%(asctime)s	字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒
%(thread)d	线程ID。可能没有
%(threadName)s	线程名。可能没有
%(process)d	进程ID。可能没有
%(message)s	用户输出的消息

如果想同时把log打印在屏幕和文件日志里，就需要了解一点复杂的知识了

Python 使用logging模块记录日志涉及四个主要类，使用官方文档中的概括最为合适：

logger提供了应用程序可以直接使用的接口；

handler将(logger创建的)日志记录发送到合适的目的输出；

filter提供了细度设备来决定输出哪条日志记录；

formatter决定日志记录的最终输出格式。

logger
每个程序在输出信息之前都要获得一个Logger。Logger通常对应了程序的模块名，比如聊天工具的图形界面模块可以这样获得它的Logger：
LOG=logging.getLogger(”chat.gui”)
而核心模块可以这样：
LOG=logging.getLogger(”chat.kernel”)

Logger.setLevel(lel):指定最低的日志级别，低于lel的级别将被忽略。debug是最低的内置级别，critical为最高
Logger.addFilter(filt)、Logger.removeFilter(filt):添加或删除指定的filter
Logger.addHandler(hdlr)、Logger.removeHandler(hdlr)：增加或删除指定的handler
Logger.debug()、Logger.info()、Logger.warning()、Logger.error()、Logger.critical()：可以设置的日志级别

handler

handler对象负责发送相关的信息到指定目的地。Python的日志系统有多种Handler可以使用。有些Handler可以把信息输出到控制台，有些Logger可以把信息输出到文件，还有些 Handler可以把信息发送到网络上。如果觉得不够用，还可以编写自己的Handler。可以通过addHandler()方法添加多个多handler
Handler.setLevel(lel):指定被处理的信息级别，低于lel级别的信息将被忽略
Handler.setFormatter()：给这个handler选择一个格式
Handler.addFilter(filt)、Handler.removeFilter(filt)：新增或删除一个filter对象

每个Logger可以附加多个Handler。接下来我们就来介绍一些常用的Handler：
1) logging.StreamHandler
使用这个Handler可以向类似与sys.stdout或者sys.stderr的任何文件对象(file object)输出信息。它的构造函数是：
StreamHandler([strm])
其中strm参数是一个文件对象。默认是sys.stderr

2) logging.FileHandler
和StreamHandler类似，用于向一个文件输出日志信息。不过FileHandler会帮你打开这个文件。它的构造函数是：
FileHandler(filename[,mode])
filename是文件名，必须指定一个文件名。
mode是文件的打开方式。参见Python内置函数open()的用法。默认是’a'，即添加到文件末尾。

3) logging.handlers.RotatingFileHandler
这个Handler类似于上面的FileHandler，但是它可以管理文件大小。当文件达到一定大小之后，它会自动将当前日志文件改名，然后创建一个新的同名日志文件继续输出。比如日志文件是chat.log。当chat.log达到指定的大小之后，RotatingFileHandler自动把文件改名为chat.log.1。不过，如果chat.log.1已经存在，会先把chat.log.1重命名为chat.log.2。。。最后重新创建 chat.log，继续输出日志信息。它的构造函数是：
RotatingFileHandler( filename[, mode[, maxBytes[, backupCount]]])
其中filename和mode两个参数和FileHandler一样。
maxBytes用于指定日志文件的最大文件大小。如果maxBytes为0，意味着日志文件可以无限大，这时上面描述的重命名过程就不会发生。
backupCount用于指定保留的备份文件的个数。比如，如果指定为2，当上面描述的重命名过程发生时，原有的chat.log.2并不会被更名，而是被删除。

4) logging.handlers.TimedRotatingFileHandler
这个Handler和RotatingFileHandler类似，不过，它没有通过判断文件大小来决定何时重新创建日志文件，而是间隔一定时间就自动创建新的日志文件。重命名的过程与RotatingFileHandler类似，不过新的文件不是附加数字，而是当前时间。它的构造函数是：
TimedRotatingFileHandler( filename [,when [,interval [,backupCount]]])
其中filename参数和backupCount参数和RotatingFileHandler具有相同的意义。
interval是时间间隔。
when参数是一个字符串。表示时间间隔的单位，不区分大小写。它有以下取值：
S 秒
M 分
H 小时
D 天
W 每星期（interval==0时代表星期一）
midnight 每天凌晨

example 1:

import logging
 
#create logger
logger = logging.getLogger('TEST-LOG')
logger.setLevel(logging.DEBUG)
 
 
# create console handler and set level to debug
ch = logging.StreamHandler()
ch.setLevel(logging.DEBUG)
 
# create file handler and set level to warning
fh = logging.FileHandler("access.log")
fh.setLevel(logging.WARNING)
# create formatter
formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
 
# add formatter to ch and fh
ch.setFormatter(formatter)
fh.setFormatter(formatter)
 
# add ch and fh to logger
logger.addHandler(ch)
logger.addHandler(fh)
 
# 'application' code
logger.debug('debug message')
logger.info('info message')
logger.warn('warn message')
logger.error('error message')
logger.critical('critical message')

example 2

import logging

from logging import handlers

logger = logging.getLogger(__name__)

log_file = "timelog.log"
#fh = handlers.RotatingFileHandler(filename=log_file,maxBytes=10,backupCount=3)
fh = handlers.TimedRotatingFileHandler(filename=log_file,when="S",interval=5,backupCount=3)


formatter = logging.Formatter('%(asctime)s %(module)s:%(lineno)d %(message)s')

fh.setFormatter(formatter)

logger.addHandler(fh)


logger.warning("test1")
logger.warning("test12")
logger.warning("test13")
logger.warning("test14")

posted @ 2016-10-26 22:46 andypengx 阅读(205) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

andypengx