朝南烟 - 博客园

2022年5月5日

摘要： 1、什么是凝聚聚类凝聚聚类（agglomerative clustering）指的是许多基于相同原则构建的聚类算法，这一原则是：算法首先声明每个点是自己的簇，然后合并两个最相似的簇，直到满足某种停止准则为止。 scikit-learn 中实现的停止准则是簇的个数，因此相似的簇被合并，直到仅剩下阅读全文

posted @ 2022-05-05 16:15 朝南烟阅读(212) 评论(0) 推荐(0) 编辑

聚类--KMeans

摘要： 1、什么是K均值聚类 k均值聚类是最简单也是最常用的聚类算法之一。它试图找到代表数据特定区域的簇中心（Cluster Center） K-means算法过程 1.随机布置K个特征空间内的点作为初始的聚类中心 2.对于根据每个数据的特征向量，从K个聚类中心中寻找距离最近的一个，并且把该数据标记为从属这阅读全文

posted @ 2022-05-05 15:53 朝南烟阅读(217) 评论(0) 推荐(0) 编辑

2022年5月1日

ML第4周学习小结

摘要：本周收获总结一下本周学习内容： 1、学习了《深入浅出Pandas》的第五章：Pandas高级操作的两个内容添加修改数据高级过滤 🚗我的博客链接： Pandas：添加修改、高级过滤 2、《Python机器学习基础教程》第三章p100-p130 预处理与缩放 🚗我的博客链接：预处理与缩放主成阅读全文

posted @ 2022-05-01 10:25 朝南烟阅读(37) 评论(0) 推荐(0) 编辑

2022年4月30日

Pandas：添加修改、高级过滤

摘要： 1、添加修改数据 Pandas 的数据修改是进行赋值，先把要修改的数据筛选出来，然后将同结构或者可解包的数据赋值给它：修改数值 df.Q1 = [1, 3, 5, 7, 9] * 20 # 就会把值进行修改 df.loc[1:3, 'Q1':'Q2'] = 99 # 这个范围的数据会全变成 99 阅读全文

posted @ 2022-04-30 15:54 朝南烟阅读(423) 评论(0) 推荐(0) 编辑

2022年4月29日

降维、特征提取与流形学习--非负矩阵分解（NMF）

摘要：非负矩阵分解(NMF)是一种无监督学习算法，目的在于提取有用的特征（可以识别出组合成数据的原始分量），也可以用于降维，通常不用于对数据进行重建或者编码。 NMF将每个数据点写成一些分量的加权求和（与PCA相同），并且分量和系数都大于0，只能适用于每个特征都是非负的数据（正负号实际上是任意的）。 1 阅读全文

posted @ 2022-04-29 15:19 朝南烟阅读(1017) 评论(0) 推荐(0) 编辑

cly的园子

公告