正则表达式
1. >>> s='aaa111aaa,bbb222,333ccc,444ddd444dd,555eee666eee,fff777ggg'
>>> re.findall(r'(?P<file>[a-z]+)\d+(?P=file)', s)
以(?P<file>\d)helloworld(?P=file) 这样匹配到的模式一定是helloworld前面有一个数字并且后面有一个一样的数字。可能为1helloworld1这样子,但不能是1helloworld2。因为后面的的(?P=file)就是去引用别名为file的分组捕获到的字符串。