摘要: 1. 密度聚类思想密度聚类思想是,只要一个区域中的点的密度大于某个阈值,就把他加到与之相近的聚类中去。优点:能对任意形状聚类,对噪声不敏感。缺点:计算密度单元的复杂度大,可以提前建立空间索引降低计算量。2. DBSCAN算法DBSCAN(Density-Based Spatial Clustering of Applications with Noise)将簇定义为密度相连的点的最大集合,能够把具... 阅读全文
posted @ 2016-07-24 10:58 ericxk 阅读(195) 评论(0) 推荐(0) 编辑
摘要: 1.聚类的思想:将一个有N个对象的数据集,构造成k(k0: freq -= 1 ##针对每个点划分类别 for i in xrange(dataNum): mindist = inf for j in xrange(k): dist = distEclud(centers[j],da... 阅读全文
posted @ 2016-07-24 10:57 ericxk 阅读(231) 评论(0) 推荐(0) 编辑
摘要: 核心就是贝叶斯公式:p(x|y) = p(x,y)/p(y) = p(y|x)p(x)/p(y)**分类原则:在给定的条件下,在哪种分类的概率大,就是哪种分类。*****举个小例子:两个信封:A1.2个红球,2个黑球,A2.1个红球,2个黑球。(1)已知从一个信封里面摸到一个红球,则这个信封是A1信封的概率。(2)已知从一个信封里面摸到一个黑球,则这个信封是A1信封的概率。P(R)红球的概率,P(... 阅读全文
posted @ 2016-07-24 10:53 ericxk 阅读(118) 评论(0) 推荐(0) 编辑