摘要: ## K-Means聚类 [TOC] 聚类,简单来说,就是将一个庞杂数据集中具有相似特征的数据自动归类到一起,称为一个簇,簇内的对象越相似,聚类的效果越好。它是一种无监督的学习(Unsupervised Learning)方法,不需要预先标注好的训练集。聚类与分类最大的区别就是分类的目标事先已知,例 阅读全文
posted @ 2023-08-06 18:18 贝壳里的星海 阅读(26) 评论(0) 推荐(0) 编辑
摘要: ## 主成分分析PCA [TOC] ### 简介 降维就是一种对高维度特征数据预处理方法。降维是将高维度的数据保留下最重要的一些特征,去除噪声和不重要的特征,从而实现提升数据处理速度的目的。利用正交变换把由线性相关变量表示的数据转换为少数几个由线性无关变量表示的数据,线性无关变量称为主成分。主成分的 阅读全文
posted @ 2023-08-06 18:18 贝壳里的星海 阅读(40) 评论(0) 推荐(0) 编辑