python15正则表达式

------------恢复内容开始------------

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

python实现实现实现实现

 

 

 

 

 

 

import re

#将表达式编译,返回一个对象,
pattern = re.compile(r"hello",re.I)#re.I忽略大小写

print(dir(pattern))
#使用对象的方法,通过match匹配
rest = pattern.match("hellossss")
print(rest)
rest1 = pattern.match("Hellossss")
print(rest1)
print(dir(rest1))


结果:
['__class__', '__copy__', '__deepcopy__', '__delattr__', '__dir__', '__doc__', '__eq__', 

'__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__',
'__init_subclass__', '__le__', '__lt__', '__ne__', '__new__', '__reduce__',

'__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__',

'findall', 'finditer', 'flags', 'fullmatch', 'groupindex', 'groups', 'match', 'pattern',

'scanner', 'search', 'split', 'sub', 'subn'] <re.Match object; span=(0, 5), match='hello'> <re.Match object; span=(0, 5), match='Hello'> ['__class__', '__copy__', '__deepcopy__', '__delattr__', '__dir__', '__doc__',

'__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__gt__', '__hash__',

'__init__', '__init_subclass__', '__le__', '__lt__', '__ne__', '__new__', '__reduce__',

'__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__',
'end', 'endpos', 'expand', 'group', 'groupdict', 'groups', 'lastgroup', 'lastindex',

'pos', 're', 'regs', 'span', 'start', 'string']

 

 

浏览全部字符串,匹配所有合规则的字符串,匹配到的字符串放到一个列表中,未匹配成功返回空列表

一旦匹配成,再次匹配,是从前一次匹配成功的,后面一位开始的,也可以理解为匹配成功的字符串,不在参与下次匹配

无分组:匹配所有合规则的字符串,匹配到的字符串放到一个列表中

有分组:只将匹配到的字符串里,组的部分放到列表里返回,相当于groups()方法

多个分组:只将匹配到的字符串里,组的部分放到一个元组中,最后将所有元组放到一个列表里返

相当于在group()结果里再将组的部分,分别,拿出来放入一个元组,最后将所有元组放入一个列表返回

分组中有分组:只将匹配到的字符串里,组的部分放到一个元组中,先将包含有组的组,看作一个整体也就是一个组,把这个整体组放入一个元组里,然后在把组里的组放入一个元组,最后将所有组放入一个列表返回

 

 

import re

#使用编译
coent = "Oone1twoT2three3"
p = re.compile(r"[a-z]+",re.I)#r表示其后的字符串按原样表示,不使用转义字符
rest = p.findall(coent) #一列表的额形式返回
print(rest)

#不编译直接使用方法
print(re.findall(r"[a-z]+",coent,re.I))

结果:

['Oone', 'twoT', 'three']
['Oone', 'twoT', 'three']

 

 

import re
content = "quan zhiqiang"
p = re.compile(r"zhi")
rest = p.search(content)
print(rest)

print("QQQQQQQQQQQQQQQQ")
rest1 = p.match(content)
print(rest1)
#因为match从第一个字符开始寻找,第一个字符不匹配直接不寻找了,
#search会继续下一个查找

print("不编译,不编译")
no_rest = re.search("zhi",content)
print(no_rest)

结果:

<re.Match object; span=(5, 8), match='zhi'>
QQQQQQQQQQQQQQQQ
None
不编译,不编译
<re.Match object; span=(5, 8), match='zhi'>

 

 

 

 

import re

def test_g():
    content = "quanzhiqiang"
    p = re.compile(r"zhi")
    rest = p.search(content)
    print(rest)#注意,当匹配不到的时候,需要对if rest 进行判断,不然直接
    if rest:
        #使用group打印会出错
        print(rest.group())
        #如果前面使用分株,可以group(1)
        print(rest.groups())#因为没有进行分组,所以为空的元组


def test_id():
    p = re.compile(r"(\d{6})(\d{4})((\d{2})(\d{2}))\d{2}\d{1}([0-9]|X)")
    id1 = "440882199904142235"
    id2 = "44088219990214228X"
    rest1 = p.search(id2)
    print(rest1.group(1))
    print(rest1.groups())#放回说有的组
    print("#######################")
    print(rest1.groupdict())


if __name__ == "__main__":
    test_g()
    test_id()


结果:
<re.Match object; span=(4, 7), match='zhi'>
zhi
()
440882
('440882', '1999', '0214', '02', '14', 'X')
#######################
{}

 

 

import re

def test_g():
    content = "quanzhiqiang"
    p = re.compile(r"zhi")
    rest = p.search(content)
    print(rest)#注意,当匹配不到的时候,需要对if rest 进行判断,不然直接
    if rest:
        #使用group打印会出错
        print(rest.group())
        #如果前面使用分株,可以group(1)
        print(rest.groups())#因为没有进行分组,所以为空的元组


def test_id():
    #p = re.compile(r"(\d{6})(\d{4})((\d{2})(\d{2}))\d{2}\d{1}([0-9]|X)")
    p = re.compile(r"(\d{6})(?P<year>\d{4})((?P<month>\d{2})(?P<day>\d{2}))\d{2}\d{1}([0-9]|X)")
    id1 = "440882199904142235"
    id2 = "44088219990214228X"
    rest1 = p.search(id2)
    print(rest1.group(1))
    print(rest1.groups())#放回说有的组
    print("#######################")
    print(rest1.groupdict())


if __name__ == "__main__":
    test_g()
    test_id()


结果;
<re.Match object; span=(4, 7), match='zhi'>
zhi
()
440882
('440882', '1999', '0214', '02', '14', 'X')
#######################
{'year': '1999', 'month': '02', 'day': '14'}

 

 

import re

s = "one1two2three333four"
p = re.compile(r"\d+")
rest = p.split(s)
print(rest)

结果:
['one', 'two', 'three', 'four']

 

import re

s = "one1two2three333four"
p = re.compile(r"\d+")
rest = p.split(s,2)#只分割前两个
print(rest)


结果:
['one', 'two', 'three333four']

 

import re

s = "one1two2three333four"
#s = "one@two@three@four"

p = re.compile(r"\d+")
rest = p.sub("@",s)
print(rest)

#原始的替换方法:
print("@@@@@@@@@@@@@@@@@@@@@@@@@@@")
rest1 = s.replace("1","@").replace("2","@").replace("333","@")
print(rest1)

#更换位置
s2 = "hello world"
p2 = re.compile(r"(\w+) (\w+)")
rest3 = p2.sub(r"\2 \1",s2)
print(rest3)

#使用函数进行替换更换并大写:
def f(m):
    return m.group(2).upper() + " " + m.group(1)
print("HHHHHHHHHHHHHHHHHHHHHHH")
rest4 = p2.sub(f,s2)
print(rest4)

#使用匿名函数替换
print("QQQQQQQQQQQQQQQQQQQQQQ")
rest6 = p2.sub(lambda m :m.group(2).upper() + " " + m.group(1),s2)
print(rest6)


结果:
one@two@three@four
@@@@@@@@@@@@@@@@@@@@@@@@@@@
one@two@three@four
world hello
HHHHHHHHHHHHHHHHHHHHHHH
WORLD hello
QQQQQQQQQQQQQQQQQQQQQQ
WORLD hello

 

 

 

 

 

 

 

 

 

------------恢复内容结束------------

posted @ 2020-04-10 21:29  linux——quan  阅读(248)  评论(0编辑  收藏  举报