2019 年 12月 11 日随笔档案 - cknds

2019年12月11日

摘要：一。数组要比列表效率高很多 numpy高效的处理数据，提供数组的支持，python默认没有数组。pandas、scipy、matplotlib都依赖numpy。 pandas主要用于数据挖掘，探索，分析 matplotlib用于作图，可视化 scipy进行数值计算，如：积分，傅里叶变换，微积分 s 阅读全文

posted @ 2019-12-11 16:46 cknds 阅读(1444) 评论(0) 推荐(0) 编辑

k-means实现聚类及聚类效果指标 k值选择方法

摘要：聚类指的是把集合，分组成多个类，每个类中的对象都是彼此相似的。K-means是聚类中最常用的方法之一，它是基于点与点距离的相似度来计算最佳类别归属。在使用该方法前，要注意（1）对数据异常值的处理；（2）对数据标准化处理（x-min(x))/(max(x)-min(x)）；（3）每一个类别的数量要大阅读全文

posted @ 2019-12-11 16:30 cknds 阅读(17849) 评论(1) 推荐(1) 编辑

K-Means 初始质心的选择

摘要： 1.随机选择选择初始质心，我们可以用最基本的随机方法，但是这种方法会导致一个局部最优解问题。即，将一个比较大的簇分裂，同时将两个较小的簇进行合并。由于K-Means算法具有不稳定性，初始质心选择不同，结果也不同。所以解决局部最优的方法，其一可以多次运行算法，选择具有最小SSE值的那组作为最终解。阅读全文

posted @ 2019-12-11 15:25 cknds 阅读(3782) 评论(0) 推荐(0) 编辑

cknds

公告