摘要: 搜索与排名1、全文搜索引擎,允许人们在大量文档中搜索一些列单词,并根据文档与这些单词的关联程度对结果进行排名。2、词干提取算法(stemming algorithm)词干提取算法试图将单词转换成对应的词干。例如,将单词“indexing”转换成“index”,这样当人们在搜索“index”时,也同样会得到包含indexing单词的文档。3、基于内容的排名法(content-based ranking)content-based ranking是根据网页的内容,利用某些可行的度量方式来对查询结果进行判断的。常用的评价度量有三个:①单词频度被查询的单词在文档中出现的次数,它可以帮助我们判断该单词与 阅读全文
posted @ 2013-04-24 17:13 elar 阅读(467) 评论(0) 推荐(0) 编辑
摘要: Sorting比较好的排序算法可以把时间复杂度控制在O(n*log2n),最糟的情况是O(n2).应该将sort当作一项基础处理,因为对于很多问题,当其数据变成sorted items时,解决起来会很容易。Stable Sorting对于key相同的元素,有时我们需要保持它们原先的顺序。但不幸的是,很少有快速算法是stable的。不过,我们可以将元素的位置作为第二参考量,当元素a.key = b.key时,原先位置小的仍然排在前面。选择排序(selection sort)选择排序就是将一个item list分为两部分,一部分是sorted,一部分是unsorted。每次都从unsorted的部 阅读全文
posted @ 2013-04-24 11:29 elar 阅读(1407) 评论(0) 推荐(1) 编辑