随笔分类 - Solr
摘要:在搜索中,我们搜索时,通常会自动返回一些相关的搜索。比如,你搜索了一本书,会自动返回作者信息加上他的其它书籍的数量。这种功能在Solr中称之为Facet。不太好翻译。下面对于参数的说明,我以搜索“手机”为例子,比较好说明一点。其中一些属性可能并不适用于中文。我的说明仅仅是举个例子。搜索"手机"时,可
阅读全文
摘要:Solr中提供了MoreLikeThis的功能,用于查询相似的文档 。应用场景(个人理解):1. 你写的文章和别人文章相似度高的话,有一方是抄袭的可能性就很大。2. 查找相似的产品。 MoreLikeThis 可以作为searchComponent使用,也可以作为requestHandler使用。
阅读全文
摘要:拼写检查也是搜索引擎必备的功能。Solr中提供了SpellCheckComponent 来实现此功能。我看过《Solr In Action》,是基于Solr4.X版本的,那时Suggestion 和 SpellCheck 用的是同一个组件。我个人感觉这两个其实也可以归为同一类概念。当你在搜索框中输入
阅读全文
摘要:搜索结果高亮显示是搜索引擎中的常用功能,在Solr中,我们可以如下配置: 常用的一些属性: 不同的hl.method,还会有不同的参数。需要用到的时候再去查询文档。 当我们输入多个单词,希望在搜索结果里不同的单词用不同的背景色显示。在Solr的样例配置中,发现<searchComponent nam
阅读全文
摘要:遇到的一些问题: 在前面的Suggest配置完后,我在 “/select” 这个 <requestHandler>里面加上了highlight的配置,可是当我在搜索框里输入字符时,竟然报如下的错误: org.apache.solr.client.solrj.impl.HttpSolrClient$R
阅读全文
摘要:当我们使用baidu或者Google时,你输入很少的字符,就会自动跳出来一些建议选项,在Solr里,我们称之为Suggest,在solrconfig.xml里做一些简单的配置,即可实现这一功能。配置如下: 元素 <searchComponent> 的属性说明: name:指定searchCompon
阅读全文
摘要:自定义fieldType时,通常还会用到filter。filter必须跟在tokenizer或其它filter之后。如: Solr 提供了很多的filter,具体如下: 1. ASCII Folding Filter 2. Beider-Morse Filter 3. Classic Filter
阅读全文
摘要:有些时候,我们需要自定义 fieldType。下面的例子就是自定义的 fieldType,<analyzer type="index"> 表示索引时怎么处理,<analyzer type="query">表示查询时怎么处理。 tokenizer: 对输入流进行分词。这里的“solr.” 代表:org
阅读全文
摘要:位于:${solr.home}\example\techproducts\solr\techproducts\conf\solrconfig.xml
阅读全文
摘要:Solr解压后的目录结构 --contrib: Solr的一些扩展 --analysis-extras: 包含一些文本分析组件及其依赖 --clustering: 包含一个用于集群搜索结果的引擎 --dataimporthandler: 把数据从数据库或其它数据源导入到solr --extracti
阅读全文
摘要:text_general default text solr.DirectSolrSpellChecker internal 0.5 2 1 5 4 ...
阅读全文
摘要:managed-schema 样例: 上面的内空抄自${solr.home}example\techproducts\solr\techproducts\conf\managed-schema 上一篇: Solr 6.7学习笔记(02)-- 配置文件 managed-schema (schema.x
阅读全文
摘要:5. <fieldType> fieldType主要定义了一些字段类型,其name属性值用于前面<field>中的type属性的值。e.g. <fieldType name="string" class="solr.StrField" sortMissingLast="true" /> 其中clas
阅读全文
摘要:接上篇 2. <dynamicField> 为满足前辍或后辍的一些字段提供统一的定义。如<dynamicField name="*_s" index="true" stored="true" type="string" /> 表示所有以“_s”为后辍的field都具有index="true" sto
阅读全文
摘要:刚学Solr(版本6.7.0),新建一个core时,提示要求schema.xml文件,我找了半天也没在源码包中找到名为schema.xml的文件。这个版本其实用的是managed-schema文件,没学过以前的版本,所以不知道是从哪个版本开始不使用schema.xml的,其实内容都一样,搞不懂为啥要
阅读全文
摘要:hl.preserveMulti 默认是false。Set to true to perform highlighting on all values of a multivalued field and preserver the order of the values(设置为true时,会高亮所
阅读全文
摘要:利用SolrJ 上传文件至Solr进行索引,比如索引一个test.pdf文件,我想在索引里添加一个文件名的字段,我在manager-schema里添加了一个字段,为“fileName”, 然后按照 guideline(http://wiki.apache.org/solr/ExtractingReq
阅读全文