会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
yoyo_sincerely
抛掉幻想,准备战斗。
博客园
首页
新随笔
联系
管理
2016年1月24日
python搜索引擎(转)
摘要: 用python如何实现一个站内搜索引擎? 先想想搜索引擎的工作流程: 1、网页搜集。用深度或者广度优先的方法搜索某个网站,保存下所有的网页,对于网页的维护采用定期搜集和增量搜集的方式。 2、建立索引库。首先,过滤掉重复的网页,虽然他们有不同的URL;然后,提取出网页的正文;最后,对正文切词,建立索引
阅读全文
posted @ 2016-01-24 09:51 yoyo_sincerely
阅读(652)
评论(0)
推荐(0)
编辑