随笔分类 - 正则表达式
摘要:非常不错的口诀,相信学习正则的朋友感觉入门很难,其实并不是想象中的难,你看下面不知道是哪位高手整理的口诀,看口诀就知道此人对正则的熟练程度非常高了。正则是每个程序员绕不开的堡垒,只有把它攻下来。我觉得正则之所以难,第一难是需要记忆,第二难是要求具备抽象逻辑思维。签于网上太多的介绍都是一篇凶悍的短文...
阅读全文
摘要:////////////////////////////////////////////////////////////////////////////////////////////////////////// /*传入文章ID 解析出文章标题*/ ///////////////////////...
阅读全文
摘要:http://www.oschina.net/question/195686_46313标题标题我自己写的正则表达式是 ".*?" (没有双引号) 只能匹配第一种,,但是不能匹配第二种,,有没有好的正则表达式匹配类似第二种这样换行的标签试试这个[\s\S]*?--------------------...
阅读全文
摘要:如何从网页上抓取有价值的东西?看懂了下面的程序(非常简单),想从网页上抓取什么信息(标题、内容、Email、价格等)就能抓取什么信息。package catchhtml;import java.io.BufferedReader;import java.io.IOException;import j...
阅读全文
摘要:正则匹配文本中的URL,方便进行长链接转短链接处理正则:((http|ftp|https)://)(([a-zA-Z0-9\._-]+\.[a-zA-Z]{2,6})|([0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}))(:[0-9]{1,4})*(/[...
阅读全文
摘要:第一,让我们看看两个特别的字符:‘^’和‘$’他们是分别用来匹配字符串的开始和结束,以下分别举例说明:"^The": 匹配以 "The"开头的字符串;"of despair$": 匹配以 "of despair" 结尾的字符串;"^abc$": 匹配以abc开头和以abc结尾的字符串,实际上是只有a...
阅读全文