Fuzzy C Means 算法及其 Python 实现——写得很清楚,见原文
Fuzzy C Means 算法及其 Python 实现
1.
算法向
算法的扩展
在 算法中,如果要将数据集合
划分为
个类,使得任意数据对象
必须属于并且仅属于一个类,同时每一个类至少包含一个数据对象,那么可以用一个
的矩阵
来表示,矩阵中的任意一个元素
可以表示为:
其中 表示第
个类。并且
需要满足如下条件
:
如果上述矩阵 中的元素
的取值范围不仅仅是 0 或者 1,那么就可以推广到模糊集合上的划分,
就变成了模糊判定矩阵。此时
需满足:
(1)
2. 目标函数与聚类中心
算法在度量数据对象的非相似性(或者说距离)时一般使用欧几里得距离,要求每个类的聚类中心与数据对象的距离平方之和最小,目标函数可以表示为:
其中 表示任意聚类中心,而聚类中心一般取类内所有对象在各属性上的平均值,因此可以表示为:
表示任意一个类。
将算法推广到模糊集后, 对样本与类中心之间的距离采用隶属度的平方来加权,
则进一步引入了隶属度的加权指数
从而得到了新的目标函数:
(2)
要使得 (2) 式达到最小值则要求聚类中心 和隶属度
满足如下条件:
(3)
(4)
3.
算法计算过程
见原文和代码实现
标签:
机器学习
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· DeepSeek 开源周回顾「GitHub 热点速览」