上一页 1 ··· 31 32 33 34 35 36 37 38 39 ··· 229 下一页
摘要: https://www.sohu.com/a/220443841_467759 Elasticsearch 是一个基于 Apache Lucene 的开源搜索和分析引擎,允许用户近实时地存储、搜索和分析数据。Pronto 是 eBay 托管 Elasticsearch 集群的平台,使 eBay 内部 阅读全文
posted @ 2018-11-19 09:53 一天不进步,就是退步 阅读(190) 评论(0) 推荐(0) 编辑
摘要: http://www.sohu.com/a/126082450_355140 目前大数据存储查询方案大概可以分为:Hbase系、Dremel系、预聚合系、Lucene系,本文作者将就自身的使用经验说说这几个系的优缺点,如有纰漏,欢迎一起探讨。 写在前面 近些年,大数据背后的价值也开始得到关注和重视, 阅读全文
posted @ 2018-11-19 09:50 一天不进步,就是退步 阅读(638) 评论(0) 推荐(0) 编辑
摘要: 网上搜到批量查询可以通过TransportClient实现,但官方推荐使用RestHighLevelClient实现 注意: 查找最新的RestHighLevelClient api文档 https://www.elastic.co/guide/en/elasticsearch/client/jav 阅读全文
posted @ 2018-11-15 17:47 一天不进步,就是退步 阅读(2730) 评论(0) 推荐(0) 编辑
摘要: https://www.infoq.cn/article/66vicQt*GTIFy33B4mu9 这是两篇系列文章中的第一篇。在2018 年的 Indaba 深度学习大会上,Herman Kamper和我组织了一场自然语言处理研讨会,整个会议的幻灯片可以在这里下载。本文将讨论用神经网络方法解决 N 阅读全文
posted @ 2018-11-15 13:49 一天不进步,就是退步 阅读(535) 评论(0) 推荐(0) 编辑
摘要: lucene 7.5.0默认的评分Similarity是BM25Similarity (IndexSearcher.java) IDF公式 f(qi,D):就是词频 |D|:[给定文档]D长度。 avgdl:索引中所有文档长度。 早期的版本使用的是TFIDFSimilarity, Lucene TF 阅读全文
posted @ 2018-11-14 17:14 一天不进步,就是退步 阅读(832) 评论(0) 推荐(0) 编辑
摘要: 简单的facet实例 查询及其关系 查询 关系 阅读全文
posted @ 2018-11-13 15:16 一天不进步,就是退步 阅读(305) 评论(0) 推荐(0) 编辑
摘要: https://www.jianshu.com/p/8a217ce05475 github地址:https://github.com/apache/lucene-solr 第一步:git clone https://github.com/apache/lucene-solr.git 下载项目 第二步 阅读全文
posted @ 2018-11-09 17:19 一天不进步,就是退步 阅读(407) 评论(0) 推荐(0) 编辑
摘要: 1.官方提供的代码demo 2.涉及到的类及其关系 2.1 TokenStream 2.2 Analyzer 2.3 Directory 2.4 IndexWriter 阅读全文
posted @ 2018-11-09 16:24 一天不进步,就是退步 阅读(378) 评论(0) 推荐(0) 编辑
摘要: 1.源码包 core: Lucene core library analyzers-common: Analyzers for indexing content in different languages and domains.analyzers-icu: Analysis integratio 阅读全文
posted @ 2018-11-09 11:35 一天不进步,就是退步 阅读(734) 评论(0) 推荐(0) 编辑
摘要: 1.术语 lucene 在存储它的全文索引结构时,是有层次结构的,这涉及到5个层次:索引(Index);段(Segment);文档(Document);域(Field);词(Term),他们的关系如下图所示:(lucene 索引存储结构概念图) 下图是Lucene生成的索引的一个实例,右边是对这5个 阅读全文
posted @ 2018-11-09 10:07 一天不进步,就是退步 阅读(829) 评论(0) 推荐(0) 编辑
上一页 1 ··· 31 32 33 34 35 36 37 38 39 ··· 229 下一页