摘要: 忙了一个月,终于把新闻采集系统做好了,最近前台工作也完成了,这几天开始测试,现放首页几天,欢迎大家提建议, 地址是:http://bbs.colorful.cn/。过几天我把采集模块部分整理一下跟大家分享,其主要思想是用多线程把各大网站的页面内容下载下来,在用正则表达式分析其内容,获取指定的内容并且下载相关的资源(包括链接和图片等资源) 阅读全文
posted @ 2006-05-18 09:19 blockhead 阅读(2231) 评论(24) 推荐(0) 编辑