正则表达式中如何解决,提取固定区间中出现特征字符最近的内容
正则表达式
-
正则表达式中如何解决,提取固定区间中出现特征字符最近的内容
#1.提取离23前面最近a的字符串 import re String= "ffasdfas住址dfasklfjsakldfjlsajf23klasjdfasl" repater = "a[^a]*(?=23)"#a后面要一直是非a,否则不再执行知道遇见23#后面的要一直执行, Ds = re.findall(repater,String, flags=0) print(Ds) #输出结果 ['ajf'] #2.提取http开头的第一个/ str = "https://bss.csdn.net/m/topic/xxxx" repater = "(http|https)://(\S+?)/" IDs = re.findall(repater,str, flags=0) print(IDs) #输出结果 ('https', 'bss.csdn.net') 3.#提取住址:**市**小区1号楼2单元301室 address_pattern = "(?<=住址.)(\S+?)[,。]" person_text = "户籍及现住址:**市**小区1号楼2单元301室。研发职业。" IDs = re.findall(address_pattern, person_text, flags=0) print(IDs)
衬衫登场是
记录学习的点点滴滴