[置顶] Hubble.net 搜索引擎分析四

摘要: 4.Hubble.Net查询过程 Hubble.net的查询过程为:首先在数据库中,通过列的match查询得到所需的原始数据。在通过倒排索引对象获取索引词的位置信息。最后组合(加亮)返回。 现已Hubble.net中的Dome项目为例子来说明Hubble.net的查询过程。如下模型图: 1.用户通过WebDome.Index.Search()方法查询数据。传递需要的参数:查询条件、索引目录、每页... 阅读全文
posted @ 2010-04-05 09:17 wayleind 阅读(665) 评论(0) 推荐(0) 编辑

[置顶] Hubble.net 搜索引擎分析三

摘要: 3.Hubble.Net建立索引 通过前面的分析,我们知道一条记录(datarow)就是一个文档。所以实质是对datarow进行索引。我们根据Table类知道一条datarow有几个索引列,并通过其列名就可以后去对应的倒排索引对象,再使用倒排索引对象索引其对应值。对应的模型图如下: 1.一个数据表对应一个DBProvider对象,需要对某个表建立索引时,只需要通过其表名称获取对应的DBProvi... 阅读全文
posted @ 2010-04-05 09:15 wayleind 阅读(441) 评论(0) 推荐(0) 编辑

[置顶] Hubble.net 搜索引擎分析二

摘要: 1. Hubble.Net运行机制 根据第一章知识,我们知道Hubble.Net系统只存储索引信息,而索引文档另存储于数据库中。.我们知道Hubble.Net采用的是倒排索引技术,索引词关联文档信息。所以索引词成为系统的关键点。根据索引词建立对应的索引信息和查询索引信息。现在我们来重点分析.hdx和.idx类型文件,以及其在系统中的表现形式和整个系统的运行机制。 1.索引的建立是根据数据索引列。系... 阅读全文
posted @ 2010-04-05 09:13 wayleind 阅读(553) 评论(0) 推荐(0) 编辑

[置顶] Hubble.Net 搜索引擎分析一

摘要: 由于本人只关系搜索这方面的知识,所以只分析Hubble.Net内部关于搜索方面的知识。本人是一个业余爱好者,所以水平有限,望大家多多指点。 注:本人分析的是0[1].7.2.0-Src版本的代码。 1. Hubble.Net 文件信息 由于Hubble.Net是和数据库结合构建搜索系统的。所以Hubble.Net只记录文档的索引信息,而文档本身内容记录与数据库中。Hubble.Net文档信息如... 阅读全文
posted @ 2010-04-05 09:11 wayleind 阅读(736) 评论(0) 推荐(0) 编辑