会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
徐小朝
简单高效的互联网产品研究
博客园
首页
新随笔
联系
订阅
管理
2010年8月21日
蜘蛛采集系统构造
摘要: 最近在做一个蜘蛛采集的软件,应用到垂直搜索系统中.经过详细分析使用方提出了以下需求:1.采集指定网站的指定内容.2.将目标网站的内容分析后转换成客户自己的数据结构.3.采集完成后自动发布到后台数据库.4..在发布过程中要做到过虑重复内容以上四个需求分别对应采集,分析,入库三个部分.针对以上需求我初步做了以下设计:
阅读全文
posted @ 2010-08-21 12:54 徐小朝
阅读(358)
评论(3)
推荐(0)
编辑
公告