由于要从各大网站采集各种信息(感兴趣的请看相关主题1、新闻采集系统完成,前台发布测试  2、网络媒体信息调研系统与新闻采集系统开发 ),所以经常要写各种各样的正则表达式(如果对正则表达式不熟悉或者想学习,请参考我收藏夹里面正则表达式的帖子),但是对于正则表达式验证,看写得是否正确一直是头痛的事情,终于发了点时间自己写了一个小小的工具,从而使工作的效率提升了不少,也拿上来给大家用用,望大家别见笑。
下载:/Files/blockhead/RegexValidToll.rar

下面使说明:
先来一张效果图,呵呵


开始了,弄些内容先,我们以新浪2006世界杯页面为例(http://2006.sina.com.cn/),取他的“焦点新闻”

点右键看源码,粘贴到工具中


写根据需求写获取”焦点新闻“栏目的正则表达式,验证获取,得到结果

把得到的结果,复制到匹配内容(原内容清空),再写获取焦点新闻条目的正则表达式,点验证按钮,得到结果;

这里说明一下,为了更好的得到视觉效果,我对匹配的结果加入了颜色标记,这样便于区分,另外,请在”要显示的分组名“中加入想要查看的匹配组名,为空的话则显示所有

posted on 2006-05-19 17:42  blockhead  阅读(3538)  评论(6编辑  收藏  举报