正则表达式
正则表达式
1.正则表达式模式被编译成一系列的字节码,然后由用C编写的匹配引擎执行字符 $ 表示“字符串的末尾”(还有一个对应的字符,尖号^,表示字符串的开始)。
2.我真正想要做的是,当 'ROAD' 出现在字符串的末尾,并且是作为一个独立
的单词时,而不是一些长单词的一部分,才对他进行匹配。为了在正则表
达式中表达这个意思,你利用 \b ,它的含义是“单词的边界必须在这里”。
3.字符串添加一个前缀r,告诉python,字符串中的所有字符都不转义
在罗马数字中,利用 7个不同字母进行重复或者组合来表达各式各样的数字。
• I = 1
• V = 5
• X = 10
• L = 50
• C = 100
• D = 500
• M = 1000
4.
^ 表示仅在一个字符串的开始匹配其后的字符串内容。
5.
^ 匹配字符串的开始。
• $ 匹配字符串的结尾。
• \b 匹配一个单词的边界。
• \d 匹配任意数字。
• \D 匹配任意非数字字符。
• x? 匹配一个可选的 x 字符 (换言之,它匹配 1 次或者 0 次 x 字符)。
• x* 匹配 0次或者多次 x 字符。
• x+ 匹配 1次或者多次 x 字符。
• x{n,m} 匹配 x 字符,至少 n 次,至多 m 次。
• (a|b|c) 要么匹配 a ,要么匹配 b ,要么匹配 c 。
• (x) 一般情况下表示一个 记忆组 (remembered group) 。你可以利用
re.search 函数返回对象的 groups() 函数获取它的值。
python 正则表达式指南:http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html
python正则表达式操作指南:http://wiki.ubuntu.org.cn/Python%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F%E6%93%8D%E4%BD%9C%E6%8C%87%E5%8D%97