2024年11月20日

AutoML(Automated Machine Learning) 自动化机器学习

摘要: AutoML(Automated Machine Learning),即自动化机器学习,是指利用机器学习算法和技术来自动化机器学习的各个阶段,包括数据预处理、特征工程、模型选择、超参数调优和模型部署等过程。以下是对AutoML的详细解释: 一、AutoML的定义与目的 AutoML旨在降低机器学习的 阅读全文

posted @ 2024-11-20 19:12 ExplorerMan 阅读(3) 评论(0) 推荐(0) 编辑

2024年11月13日

ES调优建议

摘要: 查询模块 保证ES节点有充足的内存 ES默认分配节点一半的内存给JVM(最多会分配30GB),剩余的内存用于向量索引和pagecache,节点内存不足会导致频繁触发向量索引的驱逐和加载,导致查询延迟较高。 因此需要确保数据节点有足够的内存,使向量索引常驻内存。可以通过以下方式获取节点向量数据的内存使 阅读全文

posted @ 2024-11-13 11:42 ExplorerMan 阅读(3) 评论(0) 推荐(0) 编辑

elasticsearch 的索引过程分析和segment的数据结构

摘要: 一、预备知识1.1、索引不可变看到这篇文章相信大家都知道es是倒排索引,在es的索引过程中为了满足一下特点,落盘的es索引是不可变的。 1 不需要锁。如果从来不需要更新一个索引,就不必担心多个程序同时尝试修改。 2 一旦索引被读入文件系统的缓存(内存),它就一直在那儿,因为不会改变。只要文件系统缓存 阅读全文

posted @ 2024-11-13 11:41 ExplorerMan 阅读(8) 评论(0) 推荐(0) 编辑

2024年11月8日

ES 布尔查询中 minimum_should_match 参数使用避坑

摘要: 简介: ES 布尔查询中 minimum_should_match 参数使用避坑 在 Elasticsearch (ES) 中,布尔查询(Boolean Query)是一种查询类型,它允许你组合多个查询子句以控制搜索结果的匹配逻辑。minimum_should_match 是布尔查询中一个重要的参数 阅读全文

posted @ 2024-11-08 16:16 ExplorerMan 阅读(30) 评论(0) 推荐(0) 编辑

2024年11月7日

算法笔记\python 笔记: 相似性度量

摘要: 本文介绍了多种距离度量方法,包括欧氏距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、马氏距离、夹角余弦、汉明距离、杰卡德距离、相关距离以及半正矢距离(球面距离)。这些方法在处理不同类型的数据和问题时有不同的适用性和优缺点,如欧氏距离易受离群点影响,马氏距离则考虑了变量的相关性和量纲。摘要由CSDN通 阅读全文

posted @ 2024-11-07 11:42 ExplorerMan 阅读(9) 评论(0) 推荐(0) 编辑

杰卡德相似度矩阵python

摘要: 我整理的一些关于【Python】的项目学习资料(附讲解~~)和大家一起分享、学习一下: https://d.51cto.com/Hpqqk2 使用Python计算杰卡德相似度矩阵 在数据科学与机器学习的领域,相似度度量是一项重要的技术,广泛应用于推荐系统、聚类分析和信息检索等。杰卡德相似度(Jacc 阅读全文

posted @ 2024-11-07 11:42 ExplorerMan 阅读(15) 评论(0) 推荐(0) 编辑

2024年10月22日

画图神器之争:PlantUML和Mermaid那个更适合你?

摘要: PlantUML和Mermaid都是流行的工具,用于通过文本描述快速创建图表,特别是UML图。尽管它们的目标相似,但在一些方面存在差异: 语法和易用性: PlantUML:使用一种类似于编程语言的语法,对于程序员来说可能更容易上手。它提供了丰富的语法来创建多种类型的UML图。Mermaid:它的语法 阅读全文

posted @ 2024-10-22 16:30 ExplorerMan 阅读(116) 评论(0) 推荐(0) 编辑

2024年8月22日

莱文斯坦距离Levenshtein,一个超强的 Python 库!

摘要: 更多Python学习内容:ipengtao.com 大家好,今天为大家分享一个超强的 Python 库 - Levenshtein。 Github地址:https://github.com/ztane/python-Levenshtein/ 文本相似性在许多领域如自然语言处理、数据清洗和信息检索中都 阅读全文

posted @ 2024-08-22 11:32 ExplorerMan 阅读(114) 评论(0) 推荐(0) 编辑

2024年5月16日

tttt

摘要: tttttttt 阅读全文

posted @ 2024-05-16 16:57 ExplorerMan 阅读(19) 评论(0) 推荐(0) 编辑

2024年4月12日

准确率和召回率的评估方法

摘要: 准确率和召回率的评估方法: 准确率和召回率是分类任务中常用的评估指标,它们从不同的角度衡量了分类模型的性能。以下是准确率和召回率的评估方法: 定义混淆矩阵:混淆矩阵(Confusion Matrix)是一个表格,用于展示分类模型的预测结果与实际结果之间的关系。它的行通常代表实际类别,列代表预测类别。 阅读全文

posted @ 2024-04-12 17:22 ExplorerMan 阅读(131) 评论(0) 推荐(0) 编辑

导航