2010年12月15日

摘要: 原文出处:blog.csdn.net/forfuture1978/archive/2009/10/22/4711308.aspxLucene 评分体系/机制(lucene scoring)是 Lucene 出名的一核心部分。它对用户来说隐藏了很多复杂的细节,致使用户可以简单地使用 lucene。但个人觉得:如果要根据自己的应用调节评分(或结构排序),十分有必须深入了解 lucene 的评分机制。Lucene scoring 组合使用了信息检索的向量空间模型和布尔模型。首先来看下 lucene 的评分公式(在 Similarity 类里的说明)score(q,d) = coord(q,d) &# 阅读全文
posted @ 2010-12-15 10:07 AnsenQ 阅读(2715) 评论(0) 推荐(0) 编辑
 
摘要: 1. 基本应用using System;using System.Collections.Generic;using System.Text;using Lucene.Net;using Lucene.Net.Analysis;using Lucene.Net.Analysis.Standard;using Lucene.Net.Documents;using Lucene.Net.Index;using Lucene.Net.QueryParsers;using Lucene.Net.Search;using Lucene.Net.Store;using Lucene.Net.Util;na 阅读全文
posted @ 2010-12-15 10:06 AnsenQ 阅读(124) 评论(0) 推荐(0) 编辑
 
摘要: 这是很久以前做lucene 时的总结,现在已经不用去研究那些代码,但还是分享出来给大家以帮助。谢谢1. 从Index开始无论哪种搜索引擎,都会需要自建一个index,所有的搜词准确率及快速性很大程度上取决于这类的问题。因此在建索引文件的时候,我们首先要弄清楚lucene建索引的接口及各类参数。Field是lucene的重要组成部分,其引出好些接口Filed InterfName,stringstoreindextokenStoreTermVectorKeywordYYYN(N)UnIndexedYYNNNTextY*(Y)(Y)NUnStoredY(N)(Y)(Y)*TextY(Y)(Y)(Y 阅读全文
posted @ 2010-12-15 10:05 AnsenQ 阅读(443) 评论(0) 推荐(0) 编辑
 
摘要: 2.2 Field的Boost如果说Document的Boost是一条线,那么Field的Boost则是一个点。怎么理解这个点呢?设置Document的Boost会影响所有字段。在搜索的过程中,一般至少会搜索两个Field,比如同时搜索标题和内容。而Document的Boost将同时影响标题和内容的搜索得分,但是设置Field的Boost则不会有那么大的影响,Field的Boost只会影响一个点。那这个点有什么用呢?现在来做个假设,假设,现在有一条记录是关于Lucene的,这篇文章讲得很好,我想要让别人搜索Lucene这个关键字的时候,这条记录一定排在前10。怎么办?设置Docuement的B 阅读全文
posted @ 2010-12-15 10:04 AnsenQ 阅读(344) 评论(0) 推荐(0) 编辑