python自学第13天 hashlib,re模块

import hashlib
sha=hashlib.sha3_512()#定义加密成什么格式
sha.update('how to use sha1 in 年后 '.encode('utf-8'))#定义加密的内容
print(sha.hexdigest())#转换为16进制的编码

md5=hashlib.md5()
md5.update('how to use sha1 in '.encode('utf-8'))
print(md5.hexdigest())

　　正则表达式模块 re

只要匹配到了，就有返回值。

常用正则表达式符号

'.'     默认匹配除\n之外的任意一个字符，若指定flag DOTALL,则匹配任意字符，包括换行
'^'     匹配字符开头，若指定flags MULTILINE,这种也可以匹配上(r"^a","\nabc\neee",flags=re.MULTILINE)
'$'     匹配字符结尾，或e.search("foo$","bfoo\nsdfsf",flags=re.MULTILINE).group()也可以
'*'     匹配*号前的字符0次或多次，re.findall("ab*","cabb3abcbbac")  结果为['abb', 'ab', 'a']
'+'     匹配前一个字符1次或多次，re.findall("ab+","ab+cd+abb+bba") 结果['ab', 'abb']
'?'     匹配前一个字符1次或0次
'{m}'   匹配前一个字符m次
'{n,m}' 匹配前一个字符n到m次，re.findall("ab{1,3}","abb abc abbcbbb") 结果'abb', 'ab', 'abb']
'|'     匹配|左或|右的字符，re.search("abc|ABC","ABCBabcCD").group() 结果'ABC'
'(...)' 分组匹配，re.search("(abc){2}a(123|456)c", "abcabca456c").group() 结果 abcabca456c
 [a-zA-Z] 匹配字母
 
'\A'    只从字符开头匹配，re.search("\Aabc","alexabc") 是匹配不到的
'\Z'    匹配字符结尾，同$
'\d'    匹配数字0-9
'\D'    匹配非数字
'\w'    匹配[A-Za-z0-9]
'\W'    匹配非[A-Za-z0-9]
'\s'     匹配空白字符、\t、\n、\r , re.search("\s+","ab\tc1\n3").group() 结果 '\t'
把?放在量词后面，就变成了惰性匹配，就是以最少次数的来匹配
 
'(?P<name>...)' 分组匹配 re.search("(?P<province>[0-9]{4})(?P<city>[0-9]{2})(?P<birthday>[0-9]{4})","371481199306143242").groupdict("city") 结果{'province': '3714', 'city': '81', 'birthday': '1993'}
 
最常用的匹配语法
 
re.match 从头开始匹配re.search 匹配包含
re.findall 把所有匹配到的字符放到以列表中的元素返回  如果有括号的话，就会优先括号里面的匹配，如果在括号开头加上(?:  )  就不会优先匹配了。
re.splitall 以匹配到的字符当做列表分隔符
re.sub      匹配字符并替换
仅需轻轻知道的几个匹配模式
re.I(re.IGNORECASE): 忽略大小写（括号内是完整写法，下同）M(MULTILINE): 多行模式，改变'^'和'$'的行为（参见上图）
S(DOTALL): 点任意匹配模式，改变'.'的行为
 

发表于 2018-04-27 16:26 HunterYi 阅读(132) 评论(0) 收藏举报

刷新页面返回顶部

python自学第13天 hashlib,re模块

公告