摘要: (2017 04 03 银河统计) 相似性和相异性被许多数据挖掘技术所使用,如聚类、最近邻分类、异常检测等。不同组样本之间的相似度是样本间差异程度的数值度量,两组样本越相似,它们的相异度就越低,相似度越高。通常用各种“距离”和“相关系数”作为相异度或相似度相异度度量方法。 一、距离计算 1、欧氏距离 阅读全文
posted @ 2017-04-03 17:31 银河统计 阅读(3682) 评论(0) 推荐(0) 编辑
摘要: (2017 04 02 银河统计) 聚类分析 目录概览 1.聚类的概念 2.两个距离的概念 3.聚类的分类 4.聚类方法的选择 5.聚类的过程 6.聚类分析实战 (I) 聚类分析R实战 1.对鸢尾花(Iris)数据进行聚类分析 (II) 聚类分析Python实战 1.对鸢尾花(Iris)数据进行聚类 阅读全文
posted @ 2017-04-03 00:38 银河统计 阅读(1221) 评论(0) 推荐(0) 编辑