摘要: 凝聚层次聚类:初始每个对象看成一个簇,即n个簇,合并最相似的两个簇,成(n-1)个簇,重复直到一个簇 \ 相似度衡量方法 最小距离:两个簇中最近的两个对象的距离 最大距离:两个簇中最远的两个对象的距离 平均距离:两个簇中所有对象两两距离的平均值 质心距离:两个簇质心的距离 \ DBSCAN聚类算法 阅读全文
posted @ 2020-11-17 19:07 一口盐汽水 阅读(174) 评论(0) 推荐(0) 编辑
摘要: 分k个簇,起始随机选择k个点为簇的初始质心,选取距离k个质心最近的一个加入那个簇,之后更新质心,即簇内所有数值的平均,之后继续重复直到质心不再变化或者小于一个阈值。 数据集D中n个对象,\(D= \{o_i=(x_i1,x_i2,...x_in),i=1,2,...n\}\) 簇的集合$C={C_1 阅读全文
posted @ 2020-11-17 19:06 一口盐汽水 阅读(57) 评论(0) 推荐(0) 编辑
摘要: 从样本中找与预测样本距离最近的k个数据 这k个数据所属类别投票决定了预测样本的类别 距离公式: \(d_ab=\sqrt[n]{\sum_{i=1}^m |a_i-b_i|^n}\) 余弦相似度: \(cos\Theta = \frac{\sum_{i=1}^m(a_i * b_i)}{\sqrt{ 阅读全文
posted @ 2020-11-17 19:04 一口盐汽水 阅读(76) 评论(0) 推荐(0) 编辑