摘要: 简单的搜索引擎 核心思想就是 1. 爬取指定页面,提取出页面中的url,进行递归爬取,可以指定递归深度 2. 提取网页中的文字内容,根据一定规则进行分词,保存在数据库中,分出的单词和url对应存储 3. 对查询参数分词,然后查询数据库中各个单词对应的url,然后返回 对搜索结果进行排名: 1. 基于 阅读全文
posted @ 2017-03-14 21:20 lacker 阅读(1091) 评论(0) 推荐(0) 编辑