2014年3月27日

Lucene 评分机制二 Payload

摘要: 这里使用的Lucene4.7.0和Lucene3.X稍有不同有下面三段内容,我想对船一系列的搜索进行加分 bike car jeep truck bus boat train car ship boat van subway car plane taxi boat vessel railway定义自定义的MyAnalyzer,实现对字段的有效载荷进行赋值 1 package com.pera.lucene.score.payload; 2 3 import java.io.Reader; 4 5 import org.apache.lucene.analysis.Analyzer; ... 阅读全文

posted @ 2014-03-27 15:56 shm10 阅读(533) 评论(0) 推荐(0) 编辑

Lucene 评分机制一

摘要: 1. 评分公式1.1 公式介绍这个公式是Lucene实际计算时使用的公式,是由原型公式推导而来tf(t in d)表示某个term的出现频率,定义了term t出现在当前document d的次数。 对于query中的term,出现的越多,得分就越高。idf(t)表示反向文档频率。这个参数表示docFreq(term t一共在多少个文档中出现)的反向影响值。它意味着在越少文档中出现的terms贡献的分数越高(物以稀为贵)。coord(q,d)是一个基于在该文档中出现了多少个query中的terms的得分因素。越多的查询项在一个文档中,说明些文档的匹配程度越高。默认是出现查询项的百分比。quer 阅读全文

posted @ 2014-03-27 14:32 shm10 阅读(186) 评论(0) 推荐(0) 编辑

导航