陋室铭
永远也不要停下学习的脚步(大道至简至易)

摘要: 文献地址:http://wangdg.com/understanding-and-tuning-solr-cache/ 理解Solr缓存及如何设置缓存大小 为了得到最好的检索性能,Solr会在内存中缓存不同的数据: Result Set: 检索结果 Filter: filter query结果 Do 阅读全文
posted @ 2018-08-14 17:39 宏宇 阅读(794) 评论(0) 推荐(0) 编辑
摘要: 缓存在 Solr 中充当了一个非常重要的角色,Solr 中主要有这三种缓存: Filter cache(过滤器缓存),用于保存过滤器(fq 参数)和层面搜索的结果 Document cache(文档缓存),用于保存 lucene 文档存储的字段 Query result(查询缓存),用于保存查询的结 阅读全文
posted @ 2018-08-14 17:38 宏宇 阅读(1344) 评论(0) 推荐(0) 编辑
摘要: 摘要: Solr的Filed中有很多参数,其中的index和store参数让人有点犯晕。 消失的Field 1 上面的这个Field的index和store属性都设置为false。如果你插入一片含有该field的doc到Solr,你会发现不能query这个field,就好像刚才插入的数据丢失了。 异 阅读全文
posted @ 2018-08-14 11:21 宏宇 阅读(535) 评论(0) 推荐(0) 编辑
摘要: 基本说明 Solr是一个开源项目,基于Lucene的搜索服务器,一般用于高级的搜索功能; solr还支持各种插件(如中文分词器等),便于做多样化功能的集成; 提供页面操作,查看日志和配置信息,功能全面。 solr 7 + tomcat 8实现solr 7的安装 Solr自带集成jetty,但是一般都 阅读全文
posted @ 2018-08-14 11:19 宏宇 阅读(283) 评论(0) 推荐(0) 编辑
摘要: 随着umc接入主机的数量越来越多,每天产生的syslog日志数量也在剧增, 之前一天产生的syslog数量才不 到1W,随着整个集团的网络设备不端接入,导致现在每天产生的syslog数量大概在180w左右,而这些syslog对 网络和PE同学排查线上网络设备问题又是十分重要的,他们的要求是可以提供查 阅读全文
posted @ 2018-08-14 11:18 宏宇 阅读(1000) 评论(0) 推荐(0) 编辑
摘要: 本篇是这个系类的最后一篇,但优化方案不仅于此,需要后续的研究与学习,本篇主要从schema设计的角度来做一些实践。 schema.xml 这个文件的作用是定义索引数据中的域的,包括域名称,域类型,域是否索引,是否分词,是否存储,是否标准化,是否存储项向量等等。在solr6中这个文件是存放在zooke 阅读全文
posted @ 2018-08-14 11:13 宏宇 阅读(354) 评论(0) 推荐(0) 编辑
摘要: 之前是使用12台机分布式搜索,1台为主机做索引并分发给子机,8台做大索引搜索服务,3 台做小索引搜索服务,配置基本是内存在4-8G,cpu:2-8core的服务器,索引的大小为8G。搜索的响应时间 是150ms左右。(使用solr架构的搜索服务) 在一次技术群中,中听到一位sina的架构师,他们是采 阅读全文
posted @ 2018-08-14 11:12 宏宇 阅读(366) 评论(20) 推荐(0) 编辑
摘要: 摘要:在项目中使用Solr作为搜索引擎对大数据量创建索引,提供服务,本文是作者对Solr的使用总结的一点心得体会, 具体包括使用DataImportHandler从数据库中近实时同步数据、测试Solr创建索引的性能、以及测试Solr的搜索效率总结等。 具体搜索引擎概念、Solr搭建方法、数据库mys 阅读全文
posted @ 2018-08-14 11:11 宏宇 阅读(628) 评论(0) 推荐(0) 编辑