上一页 1 ··· 6 7 8 9 10 11 12 13 14 ··· 17 下一页
摘要: 原文出自:http://www.cnblogs.com/forfuture1978/archive/2010/03/07/1680007.html在进行Lucene的搜索过程解析之前,有必要单独的一张把Lucene score公式的推导,各部分的意义阐述一下。因为Lucene的搜索过程,很重要的一个... 阅读全文
posted @ 2014-07-15 17:06 飞扬的薰衣草 阅读(149) 评论(0) 推荐(0) 编辑
摘要: 搜索总体有:term 查询, phrase查询, boolean 查询1. SOLR搜索覆盖度和准确度保证的三个搜索方式:保证准确率: AND: Search for two different terms, new and house, requiring both to match 。完全相同逻... 阅读全文
posted @ 2014-07-15 14:33 飞扬的薰衣草 阅读(311) 评论(0) 推荐(0) 编辑
摘要: 虽然本书中假设你要建索引的内容都是有着良好结构的,比如数据库表,XML文件,CSV,但在现实中我们要保存很混乱的数据,或是二进制文件,如PDF,Microsoft Office,甚至是图片和音乐文件。 我(Eric Pugh)在首次使用Solr时,就需要处理客户在几年间产生的大量PDF和Micr... 阅读全文
posted @ 2014-07-15 10:05 飞扬的薰衣草 阅读(507) 评论(0) 推荐(0) 编辑
摘要: 经常有一种情景是这样的:我们索引了N年的文章,而查询时候无论直接用相关度、或者用时间排序,都是比较鲁莽的;我们想要一种既要相关度比较高,又要时间上比较新的文章。这时候的解决办法就是,自定义日期衰减的ValueSourceQuery,然后在正常normalQuery的基础上后遭CustomScoreQ... 阅读全文
posted @ 2014-07-14 18:48 飞扬的薰衣草 阅读(715) 评论(0) 推荐(0) 编辑
摘要: 一、常用命令:1、ls 只列出文件名 (相当于dir,dir也可以使用) -A:列出所有文件,包含隐藏文件。 -l:列表形式,包含文件的绝大部分属性。 -R:递归显示。 --help:此命令的帮助。 2、cd 改变目录 cd /:进入根目录 cd :回到自己的目录(用户不同则目录也不同,root为/... 阅读全文
posted @ 2014-07-14 14:01 飞扬的薰衣草 阅读(371) 评论(0) 推荐(0) 编辑
摘要: 原文出自:http://www.blogjava.net/pengpenglin/archive/2010/02/22/313669.html在很多论坛、网上经常有网友问“为什么我使用 new String(tmp.getBytes("ISO-8859-1"), "UTF-8") 或者 new St... 阅读全文
posted @ 2014-07-10 17:56 飞扬的薰衣草 阅读(250) 评论(0) 推荐(0) 编辑
摘要: 1、^ 控制符(1)查询串上用^搜索: 天后王菲,如果希望将王菲的相关度加大,用^控制符。天后 王菲^10.5 结果就会将含有王菲的document权重加大分数提高,排序靠前,10.5为权重。(2)feild上用^name ^ 10即name含有搜索串时候,权重比content含有搜索串的权重高,分... 阅读全文
posted @ 2014-07-09 14:41 飞扬的薰衣草 阅读(412) 评论(0) 推荐(0) 编辑
摘要: 1. 编码问题的由来,相关概念的理解1.1 字符与编码的发展从计算机对多国语言的支持角度看,大致可以分为三个阶段:系统内码说明系统阶段一ASCII计算机刚开始只支持英语,其它语言不能够在计算机上存储和显示。英文 DOS阶段二ANSI编码(本地化)为使计算机支持更多语言,通常使用 0x80~0xFF ... 阅读全文
posted @ 2014-07-08 15:59 飞扬的薰衣草 阅读(173) 评论(0) 推荐(0) 编辑
摘要: 转载自:http://martin3000.iteye.com/blog/13289311、查询语法solr的一些查询语法1.1. 首先假设我的数据里fields有:name, tel, address 预设的搜寻是name这个字段, 如果要搜寻的数据刚好就是 name 这个字段,就不需要指定搜寻字... 阅读全文
posted @ 2014-07-08 09:38 飞扬的薰衣草 阅读(484) 评论(0) 推荐(0) 编辑
摘要: copyField的dest字段all本身有分析器处理:假设为mmseg4jname,title,description三个字段都复制到all字段上:其中title和description都是mmseg4j分析器的字段类型;name是string类型;搜索all上的“黄海波视频”----------... 阅读全文
posted @ 2014-07-07 17:50 飞扬的薰衣草 阅读(244) 评论(0) 推荐(0) 编辑
上一页 1 ··· 6 7 8 9 10 11 12 13 14 ··· 17 下一页