摘要: OCR版本:trwebocr:1.0.4 运行方式: CPU 机器配置:1C, 16G 样本文件:xxxxx.png(原文件) 线程组 样本 平均值(ms) 最小值(ms) 最大值(ms) 标准偏差(ms) 异常 吞吐量 (sec) 接收KB/sec 发送KB/sec 平均字节数 CPU使用情况 线 阅读全文
posted @ 2024-01-10 11:10 粒子先生 阅读(86) 评论(0) 推荐(0) 编辑
摘要: 查看显卡信息 lspci | grep -i nvidia 查看系统是否受支持 uname -m http://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#system-requirements 验证是否有编译环境 gc 阅读全文
posted @ 2024-01-10 11:07 粒子先生 阅读(63) 评论(0) 推荐(0) 编辑
摘要: 转自:https://ost.51cto.com/posts/11557 回顾自己过去的5年,从一名后端开发工程师,自我摸索、学习、探究,成为一名搜索开发工程师。复盘总结自己经历过的搜索的三个阶段,可简要概括为:(1)关键词搜索、(2)相关性搜索、(3)探索式搜索。 具体如下图: • 关键词搜索:主 阅读全文
posted @ 2024-01-10 11:03 粒子先生 阅读(43) 评论(0) 推荐(0) 编辑
摘要: 本文以 Elasticsearch 7.9.2 为准。 分片大小 日志类:单个分片不超过 50G 搜索类:单个分片不超过 20G 先估算总数据量,再根据分片大小,确定分片数。 容量规划 容量规划时要考虑的因素: 机器的软硬件配置 单个文档的尺寸,文档总数,索引大小,分片个数,副本个数 文档写入方式( 阅读全文
posted @ 2024-01-10 10:49 粒子先生 阅读(418) 评论(0) 推荐(0) 编辑
摘要: 转自:https://www.jianshu.com/p/b9a07bfb766a 序言 Elasticsearch,中文名直译弹性搜索,不仅仅在单索引内部分片层面弹性搜索,更强的是在跨索引外围支持分片弹性搜索,同比其它分布式数据产品,此特性更鲜明,代表了 Elastic 集群架构设计的优越性。 本 阅读全文
posted @ 2024-01-10 10:49 粒子先生 阅读(333) 评论(0) 推荐(0) 编辑
摘要: 方案对比 鉴于Canal是一个基于MySQL二进制日志的高性能数据同步系统, go-mysql-elasticsearch 是一个第三方插件的,虽然都可以同步mysql数据到es,由于es官方文档推荐使用canal工具来同步数据,因此主要将Canal的使用方式提供给用户。 核心概念 名词 解释 my 阅读全文
posted @ 2024-01-10 10:08 粒子先生 阅读(695) 评论(0) 推荐(0) 编辑
摘要: Logstash-input-jdbc安装 logstash-input-jdbc插件是logstash 的一个个插件,使用ruby语言开发。所以要先安装ruby,也是为了好使用ruby中的gem安装插件,下载地址: https://rubyinstaller.org/downloads/,下载下来 阅读全文
posted @ 2024-01-10 09:55 粒子先生 阅读(170) 评论(0) 推荐(0) 编辑
摘要: 作为搜索服务的使用者,我希望系统能够提供基于界面操作的,灵活的自定义热词、停用词、同义词的词典管理功能,便于用户自定义扩展符合自己业务场景的词项,进而提高搜索的准确度。 实现方案 elasticsearch-analysis-ik插件改造,使用关系型数据库存储热词、停用词。 elasticsearc 阅读全文
posted @ 2024-01-10 09:40 粒子先生 阅读(25) 评论(0) 推荐(0) 编辑
摘要: 作为系统的使用者,我希望用户输入搜索的过程中,系统能进行自动补全和搜索建议,协助用户输入更精准的关键词,提高后续全文搜索阶段文档匹配的准确度。 实现方案 用户刚开始输入的过程中,使用Completion Suggester进行关键词前缀匹配,刚开始匹配项会比较多,随着用户输入字符增多,匹配项越来越少 阅读全文
posted @ 2024-01-10 09:33 粒子先生 阅读(29) 评论(0) 推荐(0) 编辑
摘要: 作为系统的使用者,希望系统提供支持中文搜索、英文搜索、中英混搜、全拼搜索、首字母搜索、中文+全拼、中文+首字母混搜等多种方式混合的高级搜索功能,提高易用性及搜索的全面度及准确度。 实现方案 组合ik中文分词器与pinyin分词器,自定义支持中文、英文、拼音混合搜索的自定义分析器。 调整索引结构,指定 阅读全文
posted @ 2024-01-10 09:28 粒子先生 阅读(18) 评论(0) 推荐(0) 编辑
摘要: 在使用Hibernate的时候我们一般都会配置hibernate.hbm2ddl.auto这个属性,而其中的常见的属性值包括: create create-drop validate update 而在使用的过程中,update是我用的比较多的,由于官方文档对于这个属性产生的效果和使用的范围没有做详 阅读全文
posted @ 2024-01-10 08:28 粒子先生 阅读(83) 评论(0) 推荐(0) 编辑