摘要: 第一次读搜索引擎方面的文章,读的似懂非懂,先记录下来,以后再细看。摘要:本文简要概括当前搜索引擎的设计。介绍一般的网络搜索引擎结构(architecture)后依次详细介绍搜索引擎每个部分的主要技术,包括crawling, 网页存储(local web page storage),indexing,以及如何利用网页间的链接特性。第一节:介绍 面对海量的互联网网页和信息,输入关键词(query)得到希望的结果是互联网用户所需要的,这就需要设计网络搜索引擎。一般的搜索引擎使用信息检索(IR, Information Retrieval)技术,但是他是对应于规模小的,连续(coherent)的集合的 阅读全文
posted @ 2010-12-28 16:42 liyuxia713 阅读(246) 评论(0) 推荐(0) 编辑