摘要:
深入搜索引擎的关键——索引本文节选自《深入搜索引擎——海量信息的压缩、索引和查询 》一书 序言 将信息以压缩形式存储在全文数据库中,这其实只是解决信息爆炸这一难题的全部解决方案中的一部分。第2章所述的压缩技术可以节约大量的磁盘空间,它使得用 同样空间存储更多的数据成为可能。但是压缩不能解决两大难题,一是信息如何组织才能方便高效地查询;二是数据相关部分如何才能快速地抽取,因此索引也就应 运而生了。 许多人都能够熟练地使用书籍中的索引(本书的末尾也有一个索引表)1,例如在索引中查找单词“索引”,它就会引导你来到本页,使用索引不需要一页一页地搜 索信息。而且如果索引本身也是可以理解的话,即便本书以其 阅读全文