摘要:
Kmeans++算法 Kmeans++算法,主要可以解决初始中心的选择问题,不可解决k的个数问题。 Kmeans++主要思想是选择的初始聚类中心要尽量的远。 做法: 1. 在输入的数据点中随机选一个作为第一个聚类中心。 2. 对于所有数据点,计算它与已有的聚类中心的最小距离D(x) 3. 选择一个数 阅读全文
摘要:
一、聚类思想 所谓聚类算法是指将一堆没有标签的数据自动划分成几类的方法,属于无监督学习方法,这个方法要保证同一类的数据有相似的特征,如下图所示: 根据样本之间的距离或者说是相似性(亲疏性),把越相似、差异越小的样本聚成一类(簇),最后形成多个簇,使同一个簇内部的样本相似度高,不同簇之间差异性高。 二 阅读全文
摘要:
向量是由n个实数组成的一个n行1列(n*1)或一个1行n列(1*n)的有序数组; 向量的点乘,也叫向量的内积、数量积,对两个向量执行点乘运算,就是对这两个向量对应位一一相乘之后求和的操作,点乘的结果是一个标量。 点乘公式 对于向量a和向量b: a和b的点积公式为: 要求一维向量a和向量b的行列数相同 阅读全文