【语言处理与Python】3.4使用正则表达式检测词组搭配
import re
使用基本的元字符
#检测以XXX为结尾 [w for w in wordlist if re.search(‘ed$’,w)] #.匹配任何单个字符,^以X开头 [w for w in wordlist if re.search(‘^..j..t..$’,w)] #?表示出现0或者1次
(具体正则表达式相关内容,请查阅相关资料)
范围与闭包
#寻找一些由相同的按键次序打出的词汇 [w for w in wordlist if re.search(‘^[ghi][mno][jkl][def]$’,w)] #+,*有的时候被称为Kleene闭包或者干脆闭包 #一些常用的正则表达式基本元字符