07 2014 档案

Lucene 对文档打分的规则整理记录
摘要:摘引自:http://www.cnblogs.com/forfuture1978/archive/2010/02/08/1666137.htmlLucene的搜索结果默认按相关度排序,这个相关度排序是基于内部的Score和DocID,Score又基于关键词的内部评分和做索引时的 boost。默认Sc... 阅读全文

posted @ 2014-07-30 11:17 lovebeauty 阅读(4611) 评论(1) 推荐(0) 编辑

lucene 检索流程整理笔记
摘要:BooleanClause.Occur.MUST 表示andBooleanClause.Occur.MUST_NOT 表示notBooleanClause.Occur.SHOULD 表示orQueryParser.AND_OPERATOR == Operator.AND 表示and QueryPar... 阅读全文

posted @ 2014-07-28 12:24 lovebeauty 阅读(245) 评论(0) 推荐(0) 编辑

lucene 索引流程整理笔记
摘要:索引的原文档(Document)。为了方便说明索引创建过程,这里特意用两个文件为例:文件一:Students should be allowed to go out with their friends, but not allowed to drink beer.文件二:My friend Jer... 阅读全文

posted @ 2014-07-25 00:29 lovebeauty 阅读(202) 评论(0) 推荐(0) 编辑

luke 操作记录
摘要:精确查询(不需要切分词):得使用KeywordAnalyzer而不是StandardAnalyzer,原因如下:StandardAnalyzer:KeywordAnalyzer: 阅读全文

posted @ 2014-07-23 10:24 lovebeauty 阅读(190) 评论(0) 推荐(0) 编辑

Hadoop 安装记录
摘要:第一步:打开/etc 下面的 profile文件,在其中加入环境变量设置的代码doneJAVA_HOME=/home/hadoop/installer/jdk7u65PATH=$JAVA_HOME/bin:$PATHCLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HO... 阅读全文

posted @ 2014-07-21 00:51 lovebeauty 阅读(363) 评论(0) 推荐(0) 编辑

centos6.4 网络适配器设置仅主机模式
摘要:网络适配器设置仅主机模式时:1.vmnet1网卡必须开启2.设置ip3.centos的设置 阅读全文

posted @ 2014-07-20 23:57 lovebeauty 阅读(3892) 评论(0) 推荐(0) 编辑

lucene 基本原理整理
摘要:基本原理:http://www.cnblogs.com/forfuture1978/archive/2009/12/14/1623594.html所有过程:http://www.cnblogs.com/forfuture1978/archive/2010/06/13/1757479.html1.什么... 阅读全文

posted @ 2014-07-16 11:16 lovebeauty 阅读(3202) 评论(0) 推荐(1) 编辑

摘要:这是之前Lucene3.0生成的索引格式a表b表、c.这是网上找的图片(因为上面的两张表的segment都是合并了的)lucene4.9 建立的索引: 索引(Index): 在Lucene中一个索引是放在一个文件夹中的。 如上图,同一文件夹中的所有的文件构成一个Lucene索引。 段(Segment... 阅读全文

posted @ 2014-07-10 13:08 lovebeauty 阅读(506) 评论(0) 推荐(0) 编辑

javascript error
摘要:IE 6下expected identifier,string or number(缺少标示符、字符串或数字)其实就是多了一个逗号,之前没发现 阅读全文

posted @ 2014-07-02 11:10 lovebeauty 阅读(213) 评论(0) 推荐(0) 编辑


