随笔分类 -  机器学习

摘要:关联分析 概述:一种在大规模数据集中寻找有趣关系的任务。 这种关系形式:频繁项集或者关联规则。 频繁项集:经常出现在一块的物品集合。 关联规则:暗示物品之间可能存在很强的关系。 对频繁的度量: 支持度和可信度 支持度:数据集中包含该项集的记录所占的比例 可信度或者置信度: 针对诸如:{尿布}->{葡 阅读全文
posted @ 2022-09-15 16:36 酷酷的排球 阅读(363) 评论(0) 推荐(0) 编辑
摘要:关联分析 概述:一种在大规模数据集中寻找有趣关系的任务。 这种关系形式:频繁项集或者关联规则。 频繁项集:经常出现在一块的物品集合。 关联规则:暗示物品之间可能存在很强的关系。 对频繁的度量: 支持度和可信度 支持度:数据集中包含该项集的记录所占的比例 可信度或者置信度: 针对诸如:{尿布}->{葡 阅读全文
posted @ 2022-09-15 11:03 酷酷的排球 阅读(278) 评论(0) 推荐(0) 编辑
摘要:聚类算法 概述: 训练数据不存在类别标签信息,而且我们又需要根据数据特征将数据分成不同的类别, 聚类有时也被分为无监督分类, 和监督分类区别在于,聚类的训练数据没有对应的y值,而监督算法的数据有对应y值。 经典算法:K-均值聚类 K-均值聚类算法 优点:容易实现; 缺点:可能收敛到局部最小值,在大规 阅读全文
posted @ 2022-09-14 17:00 酷酷的排球 阅读(282) 评论(0) 推荐(0) 编辑
摘要:回归 线性回归 回归系数求解方法:常用最小二乘法 缺点:由于采用具有最小均方误差的无偏估计,可能出现欠拟合现象 解决办法: 局部加权线性回归 局部加权线性回归(Locally Weighted Linear Regression, LWLR) 思想:给待测点附近每一个点赋予一定的权重,在这个子集上基 阅读全文
posted @ 2022-09-14 13:34 酷酷的排球 阅读(147) 评论(0) 推荐(0) 编辑
摘要:集成算法(融合算法) 元算法(meta-algorithm) 思路:对其他算法进行组合。 使用集成算法时有多种形式: 不同算法的集成; 同一算法在不同设置下的集成; 数据集不同部分,分配给不同分类器之后的集成。 bagging(bootstrap aggregating) 自举汇聚法 定义:从原始数 阅读全文
posted @ 2022-09-13 17:55 酷酷的排球 阅读(299) 评论(0) 推荐(0) 编辑
摘要:SVM(Support Vector Machines) 支持向量机 引言 svm有很多的实现,此处介绍最流行的一种实现 序列最小化 SMO(Sequential Minimal Optimizaiton) 核函数(Kernel): 将SVM扩展到更多的数据集上 基于最大间隔分割数据 优点: 泛化错 阅读全文
posted @ 2022-08-25 17:39 酷酷的排球 阅读(98) 评论(0) 推荐(0) 编辑
摘要:LogisticRegression逻辑回归 引言: 机器学习 解决的问题,大体上分为两种 预测 和 分类。 预测: 一般采用是回归模型,比如最常用的 线性回归; 分类:采用的有 决策树,KNN, 支持向量机, 朴素贝叶斯等等模型。 其实本质上来讲是一样的,都是通过对已有数据的学习,构建模型,然后对 阅读全文
posted @ 2022-08-24 11:29 酷酷的排球 阅读(332) 评论(0) 推荐(0) 编辑
摘要:贝叶斯算法 引言 机器学习中,如KNN,逻辑回归,决策树等模型都是判别方法, 也就是直接学习出输出特征y和输入特征x之间的关系(决策函数:y = f(x) 或者条件分布P(Y|X))。 朴素贝叶斯是生成方法,直接找出输出特征y和输入特征x的联合分布P(X, Y),进而通过P(Y|X)=P(X, Y) 阅读全文
posted @ 2022-08-22 16:13 酷酷的排球 阅读(623) 评论(0) 推荐(0) 编辑
摘要:决策树 概念 决策树(Decision Tree)是一种基本的分类与回归方法。决策树模型呈树形结构,在分类问题中,表示基于特征对数据进行分类的过程。它可以认为是if-then规则的集合。 优点: 1)可以自学习。在学习过程中不需要使用者了解过多的背景知识,只需要对训练数据进行较好的标注,就能进行学习 阅读全文
posted @ 2022-08-18 14:27 酷酷的排球 阅读(189) 评论(0) 推荐(0) 编辑
摘要:图像的开闭运算 ##实例: python OpenCV使用场景 https://blog.csdn.net/qq_39507748/article/details/104539673 原理: 图像开运算和闭运算与膨胀和腐蚀运算有关, 由膨胀和腐蚀两个运算的复合与集合操作(并、交、补等)组合的运算构成 阅读全文
posted @ 2022-03-29 14:08 酷酷的排球 阅读(1010) 评论(0) 推荐(0) 编辑
摘要:凸包(Convex Hull) 数学定义:在一个向量空间中,对于给定几何X, 所有包含X的凸集的交集S被称为X的凸包 场景: 图像处理过程中,常常需要寻找图像中,包围某个物体的凸包。凸包跟多边形逼近很像,只不过它是包围 物体外层的一个凸集,这个凸集是所有能包围这个物体的凸集的交集。 图中,绿色线条所 阅读全文
posted @ 2022-03-29 10:56 酷酷的排球 阅读(3407) 评论(0) 推荐(0) 编辑
摘要:k-近邻算法 工作原理 存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签, 即我们知道样本集中每一个数据与 所属分类的对应关系。输入没有标签的新数据之后,将新数据每个特征与样本集中数据对应的特征比较,然后计算提取 样本集中特征最相似数据的分类标签。通常k是大于20的整数。最后选 阅读全文
posted @ 2022-01-04 20:38 酷酷的排球 阅读(118) 评论(0) 推荐(0) 编辑
摘要:Numpy 函数库基础 NumPy矩阵和数组的区别 Numpy 函数库中存在两种不同的数据类型(矩阵matrix和数组array),都可以处理行列表示的数字元素。 虽然它们看起来很相似,但是在这连个数据类型上执行的数学运算可能得到不同的结果,其中Numpy函数库 中的matrix与MATLAB中ma 阅读全文
posted @ 2021-12-01 20:36 酷酷的排球 阅读(92) 评论(0) 推荐(0) 编辑
摘要:######概念 交叉验证,就是重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。在此基础上可以得到多组不同的训练集和测试集,某次训练集中的某样本在下次可能成为测试集中的样本,即所谓“交叉”。 ######使用场景 数据不是很充足 阅读全文
posted @ 2021-10-11 17:55 酷酷的排球 阅读(424) 评论(0) 推荐(0) 编辑
摘要:import numpy as np import array from pydub import AudioSegment # 读取音频文件 path = r'E:\ML\project\music\data\Delacey-Dream-It-Possible.mp3' song = AudioS 阅读全文
posted @ 2020-11-25 00:11 酷酷的排球 阅读(374) 评论(0) 推荐(0) 编辑
摘要:一、安装pydub和FFmpeg下载 在编辑器中使用pip install pydub命令安装; 在FFmpeg官网,找到对应系统的下载链接; win10下载链接:https://www.gyan.dev/ffmpeg/builds/ffmpeg-git-full.7z 二、FFmpeg配置 下载到 阅读全文
posted @ 2020-11-18 23:57 酷酷的排球 阅读(1012) 评论(0) 推荐(0) 编辑
摘要:window换将下安装,配置neo4j并服务化 neo4j依赖jdk开发环境,不同版本neo4j,对jdk开发版本要求不同 一、JDK安装 1、jdk下载 下载地址:https://www.cnblogs.com/qc-id-01/p/10396089.html ! 找到对应系统的版本号,并下载 2 阅读全文
posted @ 2020-06-09 23:39 酷酷的排球 阅读(545) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示