python15正则表达式

------------恢复内容开始------------

python实现实现实现实现

import re

#将表达式编译,返回一个对象，
pattern = re.compile(r"hello",re.I)#re.I忽略大小写

print(dir(pattern))
#使用对象的方法，通过match匹配
rest = pattern.match("hellossss")
print(rest)
rest1 = pattern.match("Hellossss")
print(rest1)
print(dir(rest1))


结果：
['__class__', '__copy__', '__deepcopy__', '__delattr__', '__dir__', '__doc__', '__eq__', 

'__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__',
 '__init_subclass__', '__le__', '__lt__', '__ne__', '__new__', '__reduce__', 

'__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 

'findall', 'finditer', 'flags', 'fullmatch', 'groupindex', 'groups', 'match', 'pattern', 

'scanner', 'search', 'split', 'sub', 'subn']
<re.Match object; span=(0, 5), match='hello'>
<re.Match object; span=(0, 5), match='Hello'>
['__class__', '__copy__', '__deepcopy__', '__delattr__', '__dir__', '__doc__', 

'__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__gt__', '__hash__', 

'__init__', '__init_subclass__', '__le__', '__lt__', '__ne__', '__new__', '__reduce__', 

'__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__',
 'end', 'endpos', 'expand', 'group', 'groupdict', 'groups', 'lastgroup', 'lastindex', 

'pos', 're', 'regs', 'span', 'start', 'string']

浏览全部字符串，匹配所有合规则的字符串，匹配到的字符串放到一个列表中，未匹配成功返回空列表

一旦匹配成，再次匹配，是从前一次匹配成功的，后面一位开始的，也可以理解为匹配成功的字符串，不在参与下次匹配

无分组：匹配所有合规则的字符串，匹配到的字符串放到一个列表中

有分组：只将匹配到的字符串里，组的部分放到列表里返回，相当于groups()方法

多个分组：只将匹配到的字符串里，组的部分放到一个元组中，最后将所有元组放到一个列表里返

相当于在group()结果里再将组的部分，分别，拿出来放入一个元组，最后将所有元组放入一个列表返回

分组中有分组：只将匹配到的字符串里，组的部分放到一个元组中，先将包含有组的组，看作一个整体也就是一个组，把这个整体组放入一个元组里，然后在把组里的组放入一个元组，最后将所有组放入一个列表返回

import re

#使用编译
coent = "Oone1twoT2three3"
p = re.compile(r"[a-z]+",re.I)#r表示其后的字符串按原样表示，不使用转义字符
rest = p.findall(coent) #一列表的额形式返回
print(rest)

#不编译直接使用方法
print(re.findall(r"[a-z]+",coent,re.I))

结果：

['Oone', 'twoT', 'three']
['Oone', 'twoT', 'three']

import re
content = "quan zhiqiang"
p = re.compile(r"zhi")
rest = p.search(content)
print(rest)

print("QQQQQQQQQQQQQQQQ")
rest1 = p.match(content)
print(rest1)
#因为match从第一个字符开始寻找，第一个字符不匹配直接不寻找了，
#search会继续下一个查找

print("不编译，不编译")
no_rest = re.search("zhi",content)
print(no_rest)

结果：

<re.Match object; span=(5, 8), match='zhi'>
QQQQQQQQQQQQQQQQ
None
不编译，不编译
<re.Match object; span=(5, 8), match='zhi'>

import re

def test_g():
    content = "quanzhiqiang"
    p = re.compile(r"zhi")
    rest = p.search(content)
    print(rest)#注意，当匹配不到的时候，需要对if rest 进行判断，不然直接
    if rest:
        #使用group打印会出错
        print(rest.group())
        #如果前面使用分株，可以group(1)
        print(rest.groups())#因为没有进行分组，所以为空的元组


def test_id():
    p = re.compile(r"(\d{6})(\d{4})((\d{2})(\d{2}))\d{2}\d{1}([0-9]|X)")
    id1 = "440882199904142235"
    id2 = "44088219990214228X"
    rest1 = p.search(id2)
    print(rest1.group(1))
    print(rest1.groups())#放回说有的组
    print("#######################")
    print(rest1.groupdict())


if __name__ == "__main__":
    test_g()
    test_id()


结果：
<re.Match object; span=(4, 7), match='zhi'>
zhi
()
440882
('440882', '1999', '0214', '02', '14', 'X')
#######################
{}

import re

def test_g():
    content = "quanzhiqiang"
    p = re.compile(r"zhi")
    rest = p.search(content)
    print(rest)#注意，当匹配不到的时候，需要对if rest 进行判断，不然直接
    if rest:
        #使用group打印会出错
        print(rest.group())
        #如果前面使用分株，可以group(1)
        print(rest.groups())#因为没有进行分组，所以为空的元组


def test_id():
    #p = re.compile(r"(\d{6})(\d{4})((\d{2})(\d{2}))\d{2}\d{1}([0-9]|X)")
    p = re.compile(r"(\d{6})(?P<year>\d{4})((?P<month>\d{2})(?P<day>\d{2}))\d{2}\d{1}([0-9]|X)")
    id1 = "440882199904142235"
    id2 = "44088219990214228X"
    rest1 = p.search(id2)
    print(rest1.group(1))
    print(rest1.groups())#放回说有的组
    print("#######################")
    print(rest1.groupdict())


if __name__ == "__main__":
    test_g()
    test_id()


结果；
<re.Match object; span=(4, 7), match='zhi'>
zhi
()
440882
('440882', '1999', '0214', '02', '14', 'X')
#######################
{'year': '1999', 'month': '02', 'day': '14'}

import re

s = "one1two2three333four"
p = re.compile(r"\d+")
rest = p.split(s)
print(rest)

结果：
['one', 'two', 'three', 'four']

import re

s = "one1two2three333four"
p = re.compile(r"\d+")
rest = p.split(s,2)#只分割前两个
print(rest)


结果：
['one', 'two', 'three333four']

import re

s = "one1two2three333four"
#s = "one@two@three@four"

p = re.compile(r"\d+")
rest = p.sub("@",s)
print(rest)

#原始的替换方法：
print("@@@@@@@@@@@@@@@@@@@@@@@@@@@")
rest1 = s.replace("1","@").replace("2","@").replace("333","@")
print(rest1)

#更换位置
s2 = "hello world"
p2 = re.compile(r"(\w+) (\w+)")
rest3 = p2.sub(r"\2 \1",s2)
print(rest3)

#使用函数进行替换更换并大写：
def f(m):
    return m.group(2).upper() + " " + m.group(1)
print("HHHHHHHHHHHHHHHHHHHHHHH")
rest4 = p2.sub(f,s2)
print(rest4)

#使用匿名函数替换
print("QQQQQQQQQQQQQQQQQQQQQQ")
rest6 = p2.sub(lambda m :m.group(2).upper() + " " + m.group(1),s2)
print(rest6)


结果：
one@two@three@four
@@@@@@@@@@@@@@@@@@@@@@@@@@@
one@two@three@four
world hello
HHHHHHHHHHHHHHHHHHHHHHH
WORLD hello
QQQQQQQQQQQQQQQQQQQQQQ
WORLD hello

------------恢复内容结束------------

posted @ 2020-04-10 21:29 linux——quan 阅读(258) 评论(0) 收藏举报

刷新页面返回顶部

linux——quan

python15正则表达式

公告