摘要: hahah \theta 阅读全文
posted @ 2015-06-22 22:31 Loyal_1884 阅读(516) 评论(0) 推荐(0) 编辑
摘要: 1 K-means,该算法是相对可伸缩的和高效率的,因为它的复杂度是O(tkn),其中n是数据的总数,k是聚类的个数,t是算法循环的次数,通常 有 k,t<<n,因此算法的效率很高。其缺点是:需要用户输入最终结果的聚类个数k,而判断一个未知数据集的划分个数通常是很困难的,k个初始 点的选择对最终的聚... 阅读全文
posted @ 2015-06-22 20:54 Loyal_1884 阅读(219) 评论(0) 推荐(0) 编辑
摘要: 1,特征有四种分类:标量的,顺序的,区间尺度的以及比率尺度的。1.欧氏距离(Euclidean Distance)欧氏距离是最易于理解的一种距离计算方法,源自欧氏空间中两点间的距离公式。(1)二维平面上两点a(x1,y1)与b(x2,y2)间的欧氏距离:(2)三维空间两点a(x1,y1,z1)与b(... 阅读全文
posted @ 2015-06-22 20:27 Loyal_1884 阅读(1067) 评论(0) 推荐(0) 编辑