摘要:
凝聚层次聚类:初始每个对象看成一个簇,即n个簇,合并最相似的两个簇,成(n-1)个簇,重复直到一个簇 \ 相似度衡量方法 最小距离:两个簇中最近的两个对象的距离 最大距离:两个簇中最远的两个对象的距离 平均距离:两个簇中所有对象两两距离的平均值 质心距离:两个簇质心的距离 \ DBSCAN聚类算法 阅读全文
摘要:
分k个簇,起始随机选择k个点为簇的初始质心,选取距离k个质心最近的一个加入那个簇,之后更新质心,即簇内所有数值的平均,之后继续重复直到质心不再变化或者小于一个阈值。 数据集D中n个对象,\(D= \{o_i=(x_i1,x_i2,...x_in),i=1,2,...n\}\) 簇的集合$C={C_1 阅读全文
摘要:
从样本中找与预测样本距离最近的k个数据 这k个数据所属类别投票决定了预测样本的类别 距离公式: \(d_ab=\sqrt[n]{\sum_{i=1}^m |a_i-b_i|^n}\) 余弦相似度: \(cos\Theta = \frac{\sum_{i=1}^m(a_i * b_i)}{\sqrt{ 阅读全文