工作中收集之(正则表达式篇)

补充信息:http://www.cnblogs.com/syveen/archive/2007/05/14/745554.html

提取信息中的网络链接:(h|H)(r|R)(e|E)(f|F)  *=  *('|")?(\w|\\|\/|\.)+('|"|  *|>)?  
提取信息中的邮件地址:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)* 
提取信息中的图片链接:(s|S)(r|R)(c|C)  *=  *('|")?(\w|\\|\/|\.)+('|"|  *|>)?
提取信息中的ip地址:  (\d+)\.(\d+)\.(\d+)\.(\d+)   
提取信息中的中国手机号码:(86)*0*13\d{9}    

提取信息中的中国固定电话号码:(\(\d{3,4}\)|\d{3,4}-|\s)?\d{8}    

提取信息中的中国电话号码(包括移动和固定电话):(\(\d{3,4}\)|\d{3,4}-|\s)?\d{7,14}    

提取信息中的中国邮政编码:[1-9]{1}(\d+){5}    

提取信息中的中国身份证号:\d{18}|\d{15}    

提取信息中的整数:\d+    

提取信息中的浮点数(即小数):(-?\d*)\.?\d+    

提取信息中的任何数字  :(-?\d*)(\.\d+)?  

提取信息中的中文字符串:[\u4e00-\u9fa5]*    

提取信息中的双字节字符串  (汉字):[^\x00-\xff]*  

提取信息中的英文字符串:\w*
---------------------------------------------
电话号码正则表达式:
((\d{11})|^((\d{7,8})|(\d{4}|\d{3})-(\d{7,8})|(\d{4}|\d{3})-(\d{7,8})-(\d{4}|\d{3}|\d{2}|\d{1})|(\d{7,8})-(\d{4}|\d{3}|\d{2}|\d{1}))$)

 

匹配格式:11位手机号码,3-4位区号,7-8位直播号码,1-4位分机号
如:12345678901、1234-12345678-1234
-----------------------------------------------
手机号码 ^((\+86)|(86))?(13|15)\d{9}$

posted @ 2007-09-04 16:39  Elaine Shi  阅读(359)  评论(0编辑  收藏  举报