K-means聚类流程，欧式/余弦距离

K-means聚类：根据距离，相似性分组。相似度组内大，组间小。用途：知识发现；异常检测；特征提取与数据压缩。

K：分几个组。先随机取初始点，看每个点到初始点距离进行分组 <----> 求平均位置（一般不会落在样本上）

　　没有点再被重新划分类别（各组中心点不变化）--> 终止（收敛），得到模型

K = ？：肘部法（elbow），搜索合适的K，让total loss 最小（每个簇的MSE加和）。

　　　　total loss 在K = m时最小（为0，无误差）。K = 1时最大

　　　　找合适elbow point：此点处K增加，loss再减少会过拟合。

　　　　| A - B | - |B - C| = 收益（gain），elbow point为收益最大的点。类似梯度下降中early stopping：连续10次 losst+1 - losst < Threshold

K-means是一种高斯混合模型

深度学习中，注意力（Attention）提特征方式不同，结果不同。Data --> algorithm --> model

计算相似度：距离1.欧式

　　　　　　　　2.余弦：看θ大小，cosθ接近1相似，-1相反。

posted @ 2022-02-06 23:36 夜色无边阅读(681) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· Knight_day16

· Knight_day15

· 机器学习-聚类分析之k-means算法

· K-Means（K-均值）

· 机器学习——聚类（K-Means）

阅读排行：
· 25岁的心里话
· 闲置电脑爆改个人服务器（超详细） #公网映射 #Vmware虚拟网络编辑器
· 零经验选手，Compose 一天开发一款小游戏！
· 因为Apifox不支持离线，我果断选择了Apipost！
· 通过 API 将Deepseek响应流式内容输出到前端

昵称：夜色无边
园龄： 3年6个月
粉丝： 0
关注： 0

2025年3月

日

一

二

三

四

五

六

夜色无边