python内置的正则表达库re比较弱,而且似乎在好几年里都没太大的变化。
这里介绍这个python模块regex,实现了更多方便好用的功能。

比如: \p{han} 可以匹配汉字, \p{Latin} 可以匹配拉丁字母。相当简单,易记易用。

更多的介绍请直接看:https://pypi.python.org/pypi/regex

用pip 命令安装即可

pip install regex

regex的源码托管在这里 : https://bitbucket.org/mrabarnett/mrab-regex/

参考资料:
http://www.regular-expressions.info/unicode.html

2017-1-28 1:32:59 codegay