2016年1月24日
摘要: 用python如何实现一个站内搜索引擎? 先想想搜索引擎的工作流程: 1、网页搜集。用深度或者广度优先的方法搜索某个网站,保存下所有的网页,对于网页的维护采用定期搜集和增量搜集的方式。 2、建立索引库。首先,过滤掉重复的网页,虽然他们有不同的URL;然后,提取出网页的正文;最后,对正文切词,建立索引 阅读全文
posted @ 2016-01-24 09:51 yoyo_sincerely 阅读(652) 评论(0) 推荐(0) 编辑