re、logging日志模块

1、re：

正则就是用一些具有特殊含义的符号组合到一起（称为正则表达式）来描述字符或者字符串的方法。或者说：正则就是用来描述一类事物的规则。（在Python中）它内嵌在Python中，并通过 re 模块实现。正则表达式模式被编译成一系列的字节码，然后由用 C 编写的匹配引擎执行。

2、findall 全部找到返回一个列表：

s = "alex,meet,eva_j"
import re
print(re.findall('e',s)) # 参数1:要查找的内容,参数2:从哪查找,3、返回结果是列表的形式
结果：['e', 'e', 'e', 'e']
3、\w 匹配中文,字母,数字,下划线：

import re
s = "alex1!,你哈t2,eva_j@!"
print(re.findall("\w",s))    # 匹配字母（包含中文）或数字或下划线     ***
结果：['a', 'l', 'e', 'x', '1', '你', '哈', 't', '2', 'e', 'v', 'a', '_', 'j']
4、\W 不匹配中文,字母,数字,下划线：

import re
s = "alex1!,你哈t2,eva_j@!"
print(re.findall("\W",s))    # 匹配非字母（包含中文）或数字或下划线     ***
结果：['!', ',', ',', '@', '!']

5、\s 匹配任意的空白符：

import re
s = " zhangda@， "
print(re.findall("\s",s))    # 匹配任意空白符
结果：[' ', ' ']
6、\S 匹配不是任意的空白符：

import re
s = " zhangda@， "
print(re.findall("\S",s))    # 匹配任意非空白符包含特殊符号             ***
结果：['z', 'h', 'a', 'n', 'g', 'd', 'a', '@', '，']
7、\d 匹配数字：

import re
s = " 123zhangda@， "
print(re.findall('\d',s))    # 匹配数字                              ***
结果：['1', '2', '3']
8、\D 匹配非数字：

import re
s = " 123zhangda@， "
print(re.findall('\D',s))
结果：[' ', 'z', 'h', 'a', 'n', 'g', 'd', 'a', '@', '，', ' ']
9、\A从字符串开头匹配：

import re
s = "Adsasf"
print(re.findall("\AA",s))      #\A从字符串开头匹配、从字符串开头匹配没有就返回空列表
结果：['A']

10、^匹配字符串的开始：

import re
s = "Adsasf"
print(re.findall("^A",s))      # 匹配开头没有就返回空列表                             ***
结果：['A']
11、\Z匹配字符串的结束，如果是换行，只匹配到换行前的结果：

import re
s = "Adsasf"
print(re.findall("f\Z",s))
结果：['f']
12、\$匹配字符串的结尾：

import re
s = "Adsasf"
print(re.findall("f$",s))        # 匹配结尾                            ***
结果：['f']
13、.匹配任意字符，除了换行符，当re.DOTALL标记被指定时，则可以匹配包括换行符的任意字符。

import re
s = "!@#$5%0,1,2AAAA,113,-4,5,-6,7,9alex_meet\n"
print(re.findall(".",s))         # 匹配任意字符串(换行和制表符除外)      ***
结果：['!', '@', '#', '$', '5', '%', '0', ',', '1', ',', '2', 'A', 'A', 'A', 'A', ',', '1', '1', '3', ',', '-', '4', ',', '5', ',', '-', '6', ',', '7', ',', '9', 'a', 'l', 'e', 'x', '_', 'm', 'e', 'e', 't']

print(re.findall(".",s,re.DOTALL))
结果：['!', '@', '#', '$', '5', '%', '0', ',', '1', ',', '2', 'A', 'A', 'A', 'A', ',', '1', '1', '3', ',', '-', '4', ',', '5', ',', '-', '6', ',', '7', ',', '9', 'a', 'l', 'e', 'x', '_', 'm', 'e', 'e', 't', '\n']
14、[...]匹配字符组中的字符：

import re
s = "!@#$5%0,1,2AAAA,113,-4,5,-6,7,9alex_meet\n"
print(re.findall("[0-9a-zA-Z]",s))  # [数字0-数字9和字母a-z和A-Z]
结果：['5', '0', '1', '2', 'A', 'A', 'A', 'A', '1', '1', '3', '4', '5', '6', '7', '9', 'a', 'l', 'e', 'x', 'm', 'e', 'e', 't']

import re
s = "!@#$5%0,1,2AAAA,113,-4,5,-6,7,9alex_meet\n"
print(re.findall("[0-9]",s))  # [数字0-数字9]
结果：['5', '0', '1', '2', '1', '1', '3', '4', '5', '6', '7', '9']
15、*匹配0个或者多个左边的字符 贪婪匹配方式：

import re
s = "aleex1.!,你哈t2,eev11a_j@!1111"
print(re.findall("a*",s))
结果：['a', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', 'a', '', '', '', '', '', '', '', '', '']
16、+匹配一个或者多个左边的字符贪婪匹配方式：

import re
s = "aleex1.!,你哈t2,eev11a_j@!1111"
print(re.findall("a+",s))
结果：['a', 'a']
17、？匹配0个或者1个左边的字符，非贪婪方式：

import re
s = "aleex1.!,你哈t2,eev11a_j@!1111"
print(re.findall("a?",s))
结果：['a', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', 'a', '', '', '', '', '', '', '', '', '']
18、{n}精准匹配n个前面的表达式：

import re
s1 = "aleex1.!,你哈t2,eev11a_j@!1111"
print(re.findall("e{2}",s1))    # 精确
print(re.findall("ee",s1))
结果：['ee', 'ee']
19、{n,m}匹配n到m次由前面的正则表达式定义的片段，贪婪方式：

import re
s1 = "aleex1.!,你哈t2,eev11a_j@!1111"
print(re.findall('e{0,3}',s1))  # 范围
结果：['', '', 'ee', '', '', '', '', '', '', '', '', '', '', 'ee', '', '', '', '', '', '', '', '', '', '', '', '', '']
20、a|b 匹配a或者b：

import re
s1 = "alea121meeeeeeeet11123,wusir324"
print(re.findall("a|e",s1))           # 或
结果：['a', 'e', 'a', 'e', 'e', 'e', 'e', 'e', 'e', 'e', 'e']
21、() 匹配括号内的表达式，也表示一个组：

import re
s1 = "alea121meeeeeeeet11123,wusir324"
print(re.findall("e(e)e",s1))         # 分组
print(re.findall("m(eee)e",s1))       # 分组
print(re.findall("e(?:e)e",s1))       # 分组
结果： ['e', 'e']

　　　　['eee']
　　　　['eee', 'eee']

22、找到所有带_sb的内容：

s = 'alex_sb wusir_sb 的 alex wusir '
import re
print(re.findall("(.*)_sb",s))
print(re.findall("(.+?)_sb",s))   # .... * 0 or .... 1
print(re.findall("(.............)_sb",s))
结果： ['alex_sb wusir']

　　　　['alex', ' wusir']
　　　　['alex_sb wusir']

23、\d匹配数字：

import re
s1 = "1-2*(60+(-40.35/5)-(-4*3))"
print(re.findall("\d+",s1))
结果：['1', '2', '60', '40', '35', '5', '4', '3']
24、\. == 转义成普通的小数点：

import re
s1 = "1-2*(60+(-40.35/5)-(-4*3))"
print(re.findall("\d+\.\d+|\d+",s1))
结果：['1', '2', '60', '40.35', '5', '4', '3']
25、匹配所有的数字（包含小数包含负号）：

print(re.findall("-\d+\.\d+|-\d+|\d+",s1))
结果：['1', '-2', '60', '-40.35', '5', '-4', '3']
26、匹配所有邮箱：

import re
s2 = "http://blog.csdn.net/make164492212@163.com/article/details/51656638" # 匹配所有邮箱
print(re.findall('\w+@\d+\.com',s2))
结果：['make164492212@163.com']
27、匹配qq号：腾讯从10000开始：

import re
s6 = "1231231,324233,123,1123,2435,1234,2546,23451324,3546354,13241234"
print(re.findall('\d{5,11}',s6))
结果：['1231231', '324233', '23451324', '3546354', '13241234']
28、search、match：

search  *****  # 从字符串任意位置进行匹配,查找到一个就停止了
match  *****  # 从字符串开始位置进行匹配,找不返回None
29、split分割：

import re
print(re.split('[ ：:,;；，]','alex wusir,日天，太白;女神;肖锋：吴超'))
结果：['alex', 'wusir', '日天', '太白', '女神', '肖锋', '吴超']
30、sub替换：

import re
s = 'barry是最好的讲师，barry就是一个普通老师，请不要将barry当男神对待。'
print(re.sub('barry', 'meet',s))
结果：meet是最好的讲师，meet就是一个普通老师，请不要将meet当男神对待。
31、compile 定义匹配规则：

import re
obj = re.compile('\d{2}')
print(obj.findall("alex12345"))
结果：['12', '34']
32、给分组起名字：

import re
s = "<h1>hello</h1>"
print(re.findall("<(\w+)>",s))
结果：h1
33、logging模块：

logging -- 日志
1.记录程序运行状态
    # 时间,那个文件,报错行数,错误信息
2.用户的喜好
    # 分析用户的一些喜好,操作
3.银行
    # 账户的一些流水

我们来说一下这个logging模块,这个模块的功能是记录我们软件的各种状态,你们现在和我一起找到红蜘蛛的那个图标,然后右键找一找是不是有个错误日志.其实每个软件都是有错误日志的,开发人员可以通过错误日志中的内容对他的程序进行修改

这只是一种应用场景,有的还会将日志用于交易记录.比如你给我转账应该做记录吧,

我们使用的信用卡,每消费的一笔都会记录,我们来看看这个日志怎么用?

我们先来看一下函数式简单配置

import logging  
logging.debug('debug message')  
logging.info('info message')  
logging.warning('warning message')  
logging.error('error message')  
logging.critical('critical message')

默认情况下Python的logging模块将日志打印到了标准输出中，且只显示了大于等于WARNING级别的日志，这说明默认的日志级别设置为WARNING

（日志级别等级CRITICAL > ERROR > WARNING > INFO > DEBUG），

默认的日志格式为日志级别：Logger名称：用户输出消息。

我们自己用函数写的这个可以正常使用但是不够灵活,我们看看这个灵活的

灵活配置日志级别，日志格式，输出位置:

import logging  
logging.basicConfig(level=logging.DEBUG,  
                    format='%(asctime)s %(filename)s[line:%(lineno)d] %(levelname)s %(message)s',  
                    datefmt='%a, %d %b %Y %H:%M:%S',  
                    filename='/tmp/test.log',  
                    filemode='w')  

logging.debug('debug message')  
logging.info('info message')  
logging.warning('warning message')  
logging.error('error message')  
logging.critical('critical message')

logging.debug("这是调试")
logging.info("这是信息")
logging.warning("这是警告")
logging.error("这是错误")
logging.critical("这是危险")

basicConfig()函数中可通过具体参数来更改logging模块默认行为，可用参数有：

filename：用指定的文件名创建FiledHandler，这样日志会被存储在指定的文件中。
filemode：文件打开方式，在指定了filename时使用这个参数，默认值为“a”还可指定为“w”。
format：指定handler使用的日志显示格式。
datefmt：指定日期时间格式。
level：设置记录日志的级别
stream：用指定的stream创建StreamHandler。可以指定输出到
sys.stderr,sys.stdout或者文件(f=open(‘test.log’,’w’))，默认为sys.stderr。若同时列出了filename和stream两个参数，则stream参数会被忽略。

format参数中可能用到的格式化串：

%(name)s Logger的名字
%(levelno)s 数字形式的日志级别
%(levelname)s 文本形式的日志级别
%(pathname)s 调用日志输出函数的模块的完整路径名，可能没有
%(filename)s 调用日志输出函数的模块的文件名
%(module)s 调用日志输出函数的模块名
%(funcName)s 调用日志输出函数的函数名
%(lineno)d 调用日志输出函数的语句所在的代码行
%(created)f 当前时间，用UNIX标准的表示时间的浮点数表示
%(relativeCreated)d 输出日志信息时的，自Logger创建以来的毫秒数
%(asctime)s 字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒
%(thread)d 线程ID。可能没有
%(threadName)s 线程名。可能没有
%(process)d 进程ID。可能没有
%(message)s用户输出的消息

logger对象配置

import logging

logger = logging.getLogger()
# 创建一个handler，用于写入日志文件
fh = logging.FileHandler('test.log',encoding='utf-8') 

# 再创建一个handler，用于输出到控制台 
ch = logging.StreamHandler() 
formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')

fh.setLevel(logging.DEBUG)

fh.setFormatter(formatter) 
ch.setFormatter(formatter) 
logger.addHandler(fh) #logger对象可以添加多个fh和ch对象 
logger.addHandler(ch) 

logger.debug('logger debug message') 
logger.info('logger info message') 
logger.warning('logger warning message') 
logger.error('logger error message') 
logger.critical('logger critical message')

logging库提供了多个组件：Logger、Handler、Filter、Formatter。Logger对象提供应用程序可直接使用的接口，Handler发送日志到适当的目的地，Filter提供了过滤日志信息的方法，Formatter指定日志显示格式。另外，可以通过：logger.setLevel(logging.Debug)设置级别,当然，也可以通过

fh.setLevel(logging.Debug)单对文件流设置某个级别。

import logging
looger = logging.getLogger() # 创建一个空架子
fh = logging.FileHandler('test1.log',mode="a",encoding="utf-8")
# 创建一个文件句柄,用来记录日志(文件流)
ch = logging.StreamHandler()
# 创建一个屏幕流,打印记录的内容
f_str = logging.Formatter("%(asctime)s %(name)s %(levelname)s %(filename)s %(lineno)s %(message)s")
# 定义一个记录日志的格式
looger.level = 10
# 设置一个记录级别
fh.setFormatter(f_str)  # 给文件句柄设置记录内容的格式
ch.setFormatter(f_str)  # 给中控台设置打印内容的格式
looger.addHandler(fh)   # 将文件句柄添加的looger对象中
looger.addHandler(ch)   # 将中控台添加的looger对象中
looger.debug(1234)     # 咱们二次开发实现的
looger.info(1234)      # 咱们二次开发实现的
looger.warning(1234)   # 咱们二次开发实现的
looger.error(1234)     # 咱们二次开发实现的
looger.critical(1234)  # 咱们二次开发实现的
"""
# logging.debug()      # 人家自带的

import re
def TaskId(results):
    global TaskId
    regx = '.*"TaskId":(.*),"PlanId"'
    pm = re.search(regx, results)
    if pm:
        TaskId = pm.group(1).encode('utf-8')
        return TaskId
    return False
if __name__ == '__main__':
    results = '"TaskId":000123456,"PlanId"'
    value = TaskId(results)
    print(value.decode('utf-8'))
    print('Done!')
结果：000123456

Done!

def GetToken():  # 取用户登录的 token 值
    global token  # 定义 token 全局变量
    url = 'http://192.168.215.55/user/login.do'  # 接口的 URL
    params = {
        'phone': '13798359580',
        'pwd': '123456',
    }  # 参数为登录手机号和密码
    request = urllib2.Request(url=url, data=urllib.urlencode(params))  # 发送接口# 请求 URL 和参数
    response = urllib2.urlopen(request)  # 返回响应数据
    data = response.read()
    regx = '.*"token":"(.*)","ud"'  # 正则表达式 token，左匹配 "token":" 右匹配","ud"'
    pm = re.search(regx, data)  # 取 token 匹配值
    token = pm.group(1)  # 如果匹配到，则返回 token 值
    return token
print(GetToken())
结果：p:sid:e3f9ff89eaf74a3ba208aa6ba74d00a44043

posted @ 2019-10-19 18:55 干it的小张阅读(233) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

干it的小张

re、logging日志模块

公告