随笔分类 - 正则
摘要:最近做一个微博类的工作站,哭哭找没找到,只能自己根据需求写了一个识别以中文和空格作为结束符号短地址识别正则如下:((http|https|ftp|ftps):\/\/)?([a-zA-Z0-9-]+\.){1,5}(com|cn|net|org|hk|tw)((\/(\w|-)+(\.([a-zA-Z]+))?)+)?(\/)?(\??([\.%:a-zA-Z0-9_-]+=[#\.%:a-zA-Z0-9_-]+(&)?)+)?解释:((http|https|ftp|ftps):\/\/)?表示是否带有请求的头部([a-zA-Z0-9-]+\.){1,5}(com|cn|net
阅读全文
摘要:匹配重复匹配正则表达式中有一些用于重复匹配某些原子的元字符:“?”、“*”、“+”。他们主要的区别是重复匹配的次数不同。元字符“?”:表示0次或1次匹配紧接在其前的原子。例如:/colou?r/匹配“colour”或“color”。元字符“*”:表示0次、1次或多次匹配紧接在其前的原子。例如:/zo*/可以匹配z、zoo元字符“+”:表示1次或多次匹配紧接在其前的原子。例如:/go+gle/匹配“gogle”、“google”或“gooogle”等中间含有多个o的字符串。元字符“{}”准确地指定原子重复的次数,指定所匹配的原子出现的次数。“{m}”表示其前原子恰好出现m次;“{m,n}”表示其
阅读全文
摘要:目前,正则表达式已经在很多软件中得到广泛的应用,包括*nix(Linux, Unix等),HP等操作系统,PHP,C#,Java等开发环境,以及很多的应用软件中,都可以看到正则表达式的影子。正则表达式是用来匹配一类字符串的一种模式正则表达式的功能:字符串的查找、替换以及分割应用领域广泛Perl、PHP、Java、C++、C#、Python、 Xpath、.Net、JavaScript、JscriptOracle、Mysql、Unix、Linux正则语法:正则表达式主要组成: 1 原子(普通字符,如英文字符) 2 元字符(有特殊功用的字符) 3 模式修正字符(对正则表达式语义的修正)一个正则表达
阅读全文