摘要: 5.1 Spring Data 框架集成5.1.1 Spring Data 框架介绍 Spring Data 是一个用于简化数据库、非关系型数据库、索引库访问,并支持云服务的开源框架。其主要目标是使得对数据的访问变得方便快捷,并支持 map-reduce 框架和云计算数据服务。 Spring Dat 阅读全文
posted @ 2021-04-18 14:24 searchDM 阅读(145) 评论(0) 推荐(0) 编辑
摘要: 3.1 相关概念 3.1.1 单机 & 集群 单台 Elasticsearch 服务器提供服务,往往都有最大的负载能力,超过这个阈值,服务器性能就会大大降低甚至不可用,所以生产环境中,一般都是运行在指定服务器集群中。 除了负载能力,单点服务器也存在其他问题: 单台机器存储容量有限 单服务器容易出现单 阅读全文
posted @ 2021-04-18 12:08 searchDM 阅读(70) 评论(0) 推荐(0) 编辑
摘要: 6.1 硬件选择 Elasticsearch 的基础是 Lucene,所有的索引和文档数据是存储在本地的磁盘中,具体的路径可在 ES 的配置文件../config/elasticsearch.yml 中配置,如下: # Paths # # Path to directory where to sto 阅读全文
posted @ 2021-04-18 11:10 searchDM 阅读(254) 评论(0) 推荐(0) 编辑
摘要: 2.1 Elasticsearch 安装 2.1.1 下载软件Elasticsearch 的官方地址:https://www.elastic.co/cn/Elasticsearch 最新的版本是 7.11.2(截止 2021.3.10),我们选择 7.8.0 版本(最新版本半年前的版本)下载地址:h 阅读全文
posted @ 2021-04-17 12:59 searchDM 阅读(119) 评论(0) 推荐(0) 编辑
摘要: 1.1 Elasticsearch 是什么 The Elastic Stack, 包括 Elasticsearch、Kibana、Beats 和 Logstash(也称为 ELK Stack)。能够安全可靠地获取任何来源、任何格式的数据,然后实时地对数据进行搜索、分析和可视化。Elaticsearc 阅读全文
posted @ 2021-04-17 08:48 searchDM 阅读(87) 评论(0) 推荐(0) 编辑
摘要: supervised-ml-sentiment-analysis Supervised ML(training) 在监督机器学习中你要输入特征X和一组标签Y。现在为了确保基于你的数据能够得到最准确的预测,你的目标是尽可能减少错误率或成本。为了做到这一点,你要运行你的预测函数,它接受参数数据来映射你的 阅读全文
posted @ 2021-04-17 07:53 searchDM 阅读(184) 评论(0) 推荐(0) 编辑
摘要: 1,字符串转整型(一)#include <stdlib.h>int atoi(const char *nptr);字符串转化为整型long atol(const char *nptr);字符串转化为长整型long long atoll(const char *nptr);long long atoq(const char *nptr);字符串转化为long long 类型英文手册很简单,直接上说明:The atoi() function converts the initial portion of the string pointed to by nptr to int. The 阅读全文
posted @ 2013-03-30 08:55 searchDM 阅读(6882) 评论(0) 推荐(0) 编辑
摘要: solr 有facet search ,BOBO也有;现在lucene3.4之后也有了,这个是贡献版本,在apache 官方的包里面有提供,这种功能对于分组统计和类别统计是一个很好的帮手;有了这个就不用羡慕solr了,不是我抗拒solr,只是像我们公司有时间让我们开发的情况下,我更偏向于底层点的api开发,lucene更得心应手。再说现在的solr没有近实时搜索,听说要4.0后有。废话不说,直接上代码public class Indexer { //需要索引的信息 public static String[] docTitles = { "white car", " 阅读全文
posted @ 2013-03-28 10:40 searchDM 阅读(444) 评论(0) 推荐(0) 编辑
摘要: Sphinx(狮身人面像) 想必大家都比较了解,就不作介绍了,不了解的童鞋可以自己Google。 原生的Sphinx只支持中文, 所以这里重点介绍支持中文分词的 Coreseek。 注意:Coreseek 3.2 后,只有安装 Coreseek 就可以了,它对LibMMSeg和sphinx做了整合,不用再安装原生Sphinx。(3.2前是要安装原生Sphinx,还要装补丁,非常繁琐) 安装coreseek 下面以coreseek-3.2.14为例,它基于Sphinx 0.99(不用安装Sphinx 0.99) 详细官方手册:http://www.coreseek.cn/product... 阅读全文
posted @ 2011-10-17 08:41 searchDM 阅读(542) 评论(0) 推荐(0) 编辑
摘要: Solr 是基于lucene的检索服务器。能够很快的搭建检索服务,并且提供的很多实用的组件。例如 高亮(highlight)、拼写检查(spellCheck)和匹配相位(moreLikeThis)。下面我将在我工作中接触到的一些实践与大家分 享。(我当前使用的solr 版本是 3.4,使用tomcat 7.0.21) (如果你也使用的是 tomcat 服务器,而且查询请求包含中文的话,还需要 修改 TOMCAT_HOME/conf/server.xml 的 <Connector ... URIEncoding="UTF-8"/> 使用 UTF-8 编码,详见 U 阅读全文
posted @ 2011-10-17 08:31 searchDM 阅读(1030) 评论(0) 推荐(0) 编辑