Normalized Mutual Information(NMI, 归一化互信息)
Normalized Mutual Information(NMI, 归一化互信息)
- 值域是
,值越高表示两个聚类结果越相似。归一化是指将两个聚类结果的相似性值定量到 之间。
- 其中Y代表数据真实的类别;C表示聚类的结果。
表示信息熵, ,此处的 以2为底。 代表互信息, ,互信息是信息论里的一种信息度量,可以看成是一个随机变量中包含的关于另一个随机变量的信息量。
例子
假定共有20个样本,真实类簇为3个,而模型学习得到2个类簇,如下:
-
计算
的信息熵H(Y) 表示数据真实标签的交叉熵,它是一个固定的值。可以在聚类之前计算出。
-
计算
的信息熵
𝐻(𝐶)表示数据聚类后标签的交叉熵,每得到一个聚类结果都需要计算一下。 -
计算
和 的互信息 -
计算
和 的归一化互信息
【推荐】还在用 ECharts 开发大屏?试试这款永久免费的开源 BI 工具!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· C# 13 中的新增功能实操
· Ollama本地部署大模型总结
· 【杭电多校比赛记录】2025“钉耙编程”中国大学生算法设计春季联赛(4)
· langchain0.3教程:从0到1打造一个智能聊天机器人
· 用一种新的分类方法梳理设计模式的脉络