摘要: 原理简介:Oracle通过其专利的词法分析器(lexer),将文章中所有的表意单元(Oracle称为term)找出来,记录在一组以dr$开头的表中,同时记下该term出现的位置、次数、hash值等信息。检索时,Oracle从这组表中查找相应的term,并计算其出现频率,根据某个算法来计算每个文档的得分(score),即所谓的‘匹配率’。而lexer则是该机制的核心,它决定了... 阅读全文
posted @ 2010-07-09 01:30 Nicholas_F 阅读(736) 评论(0) 推荐(0) 编辑