04 2015 档案
摘要:测试软件环境: 1、16G windows7 x64 32core cpu 。 2、jdk 1.7 tomcat 6.x solr 4.8数据库软件环境: 1、16G windows7 x64 32core cpu 。 2、Oracle 11g一、Solr默认索引工具DIH。...
阅读全文
摘要:Lucene在进行关键词查询的时候,默认用TF-IDF算法来计算关键词和文档的相关性,用这个数据排序TF:词频,IDF:逆向文档频率,TF-IDF是一种统计方法,或者被称为向量空间模型,名字听起来很复杂,但是它其实只包含了两个简单规则某个词或短语在一篇文章中出现的次数越多,越相关整个文档集合中包含某...
阅读全文
摘要:最近,需要对项目进行lucene版本升级。而原来项目时基于lucene 3.0的,很古老的一个版本的了。在老版本中中,我们主要用了几个lucene的东西: 1、查询lucene多目录索引。 2、构建RAMDirectory,把索引放到内存中,以提高检索效率。 3、构建Lucene自定义分词...
阅读全文
摘要:Spellcheck是Lucene新版本的功能,在介绍spellcheck之前,我们需要弄清楚Spellcheck支持几种数据源。Spellcheck构造函数需要传入Dictionary接口: package org.apache.lucene.search.spell;/* * Licens...
阅读全文