摘要: 在没有了解RFC1738的时候,一直以为Url的正则表达式很简单,没想到Url有这么多分类,更没想到一个普通的http的正则表达式也不是那么简单。以下是我搜到的关于http的正则表达式:http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?复制代码当然这已经满足大部分人的需求了,但是如果需要严格的验证的话还是要符合RFC1738了。Url包括Http,Ftp,News,Nntpurl,Telnet,Gopher,Wais,Mailto,File,Prosperurl和Otherurl。呵呵,废话不多说了,上代码#region Http string low. 阅读全文
posted @ 2011-10-01 18:03 星月磊子 阅读(16603) 评论(0) 推荐(1) 编辑
摘要: 今天做文章抓取程序的完善开发,碰到了以下问题“<a href=aaa.html>A页</a><a href=bbb.html>B页</b>” 利用正则从中分别取出 aaa.html ,A页 ,bbb.html,B页。自己写了俩正则 算是都能实现,但是是先匹配出所有的href对应的Html,再匹配出类似"A页"标题这段。 但是感觉很麻烦,从网上一搜,果然看到有位大侠写的正则很简炼,贴出记下,膜拜之MatchCollectionmc=Regex.Matches(htmlstring,@"<a\s+href=(?&l 阅读全文
posted @ 2011-10-01 16:13 星月磊子 阅读(755) 评论(0) 推荐(0) 编辑
摘要: 首先,我们要准备的文件有:jquery.js,jquery.pagination.js,pagination.css,还有一个就是经常用的table布局的css文件。这些文件都会在后面的文件中包含。先把要用到的文件依次进入进来:<script src="common/jquery.js" type="text/javascript"></script><script src="common/jquery.pagination.js" type="text/javascript"> 阅读全文
posted @ 2011-10-01 15:13 星月磊子 阅读(196) 评论(0) 推荐(0) 编辑