随笔分类 -  机器学习

摘要:引言 有一个很经典的例子,或许你也听过:超市里面发现,尿布和啤酒,经常出现在同一张购物单上。这两个毫不相干的事情,为什么会产生联系?后来发现,原来是因为,有时候母亲在家中照看婴儿,父亲会去超市购买尿布。父亲在购买尿布的同时,往往会顺便为自己购买啤酒,这样,啤酒与尿布这两件看上去不相干的商品,就经常会 阅读全文
posted @ 2026-02-27 17:42 1234roro 阅读(5) 评论(0) 推荐(0)
摘要:概念 如下一些例子,都是聚类: 发现不同的客户群,刻画不同的消费群体的特征 推导植物和动物的种类 基因和蛋白质的分类 气候带的划分 文档的归类 对比理解,会好理解一些:分类,是先定好标准,1,2,3,然后把一堆事物分好类别,分别归类到1,2,3中;聚类,是我自己也不知道有什么标准,我就想看着这一堆数 阅读全文
posted @ 2026-02-02 17:09 1234roro 阅读(8) 评论(0) 推荐(0)
摘要:数据工作逻辑 1、定义问题对应的数据 • 原始数据集 • 通过各种方式获取,如公共平台、个人整理等 2、定义数据体现的特征,和数据之间的关系 • 根据数据集,你可以得到的一些特征,比如可用性、利润程度等 • 通过思考你的目标是什么,需要什么指标去衡量,指标即特征 3、数据分析。分为训练、开发和测试 阅读全文
posted @ 2026-01-15 14:32 1234roro 阅读(10) 评论(0) 推荐(0)
摘要:概念分类 我们常说的人工智能、机器学习、深度学习,他们的关系是什么?如何演进的? 数据分析技术介绍 数据分析,大体上可以分成两类:统计回归和机器学习。统计回归,主要有OLS线性回归、Logistic回归等方法。在机器学习领域,主要使用的方法有聚类(K-means)、分类(J48决策树)、关联分析(M 阅读全文
posted @ 2026-01-15 11:41 1234roro 阅读(7) 评论(0) 推荐(0)
摘要:介绍 cherry studio,是一个工具框架,其核心智能的计算等功能,均来自接入的模型服务商,需要通过使用对应模型厂商的API密钥,去调用对应模型的服务。 源代码 https://github.com/CherryHQ/cherry-studio Cherry Studio 官方的 GitHub 阅读全文
posted @ 2025-08-05 16:22 1234roro 阅读(1552) 评论(0) 推荐(0)
摘要:应用场景 找到事物和事物之间的联系。比如购物篮分析,根据顾客的购物篮情况,推测,哪些产品经常一起购买,这样商场更明白如何进行推销。 常见算法 Apriori。通过对物品的支持度、置信度、提升度的计算,以此了解两个物品之间的关联性。这里其实涉及了两个目标: 1、了解我当前应该怎么捆绑销售,就是直接把某 阅读全文
posted @ 2024-07-12 16:11 1234roro 阅读(148) 评论(0) 推荐(0)
摘要:适用场景 没有给定一些分类的标签,让你对现有数据基于算法,自己分堆儿(聚类)。 常用算法 K-Means:核心思想就是,自己先假定,一共要分几个类,然后每个类里,你要定一个c位。然后对每个点,都算一下到每个类c位的距离,哪个最小,就划入哪个类。每个点都划分好以后,对每个类的c位进行一次更新。然后继续 阅读全文
posted @ 2024-07-11 11:45 1234roro 阅读(55) 评论(0) 推荐(0)
摘要:使用场景:做分类的,比如银行想做客户分类,看看新的这个客户,他是高风险用户还是低风险用户。 原理使用:可以用贝叶斯分类,决策树算法,还有KNN,本篇主要整理KNN。 KNN原理:有N个样本点,对新纪录r,使用KNN进行分类,看它属于哪个分类。具体如下: 1、先确定k值,不建议太大,一般采用交叉验证法 阅读全文
posted @ 2024-06-18 18:18 1234roro 阅读(74) 评论(0) 推荐(0)
摘要:整体概念 有监督学习,就是会有一些 已有的标签等已经做好分类的信息,你基于一些算法,把新拿到的数据,贴上对的标签;无监督学习,就是没有标签,你就自己算吧,自己把这一堆数据做不同的聚类。 线性回归 整理原因:为了更好地理解学习算法为什么有用、可靠,还是决定认真看看推导公式和过程。以下是有监督学习线性回 阅读全文
posted @ 2024-06-07 18:26 1234roro 阅读(110) 评论(0) 推荐(0)