通过正则表达式作为规则,筛检白名单和黑名单以控制访问网页路径,不断自动访问符合条件的网址。可附带下载资源文件。

此程序适合挂机伪装普通用户、挂机博客互踩、挂机论坛下载图片、附件等应用。

image

image

使用方法:

首先建立白名单访问规则,比如我们要爬CnBeta的网页,就这样设置,然后点击“在页面中验证”按钮测试符合规则的链接:

image

然后,如果我们不希望重复爬到编辑推荐的内容的话,就在黑名单中这样设置并验证:

image

然后点击“开始获取”,程序就开始自动爬了。

其他设置自行尝试吧,都比较简单了。

 

程序下载:http://www.uushare.com/user/icesee/file/2743570

源代码下载:http://www.uushare.com/user/icesee/file/2743571

posted on 2010-03-18 15:24  斯克迪亚  阅读(5269)  评论(0编辑  收藏  举报