【转载】 使用t-SNE可视化图像embedding
原文地址: https://zhuanlan.zhihu.com/p/81400277
================================================
t-SNE(t-Distributed Stochastic Neighbor Embedding)是一种非常流行的非线性降维技术,主要用来对高维数据进行可视化。
本文将尽可能是使用简单的数学公式描述出t-SNE的工作原理,并给出使用t-SNE对图像的embedding进行可视化的code sample。
什么是t-SNE
为了达到这一目的,t-sne将原始空间的相似性建模为概率密度。并且相似性的分布方式由高斯分布给出。简而言之,在原始空间中,某个点和其他点的相似度可以用一个概率密度分布来表示:
在降维后的空间中,我们用学生t分布(Student's t-distribution)代替高斯分布,因为学生t分布有更粗的尾巴,能够保留更多较远的距离的相似度。所以在降维后的目标空间中,联合概率分布为如下形式:
我们的目的是为了让这个两个概率分布尽可能的相似,这样就说明在降维后的数据分布和原始空间的数据分布基本一致,因此使用KL散度进行度量这两个分布之间的相似度:
================================
参考文献:
[1] Maaten, Laurens van der, and Geoffrey Hinton. “Visualizing data using t-SNE.” Journal of machine learning research 9.Nov (2008): 2579-2605
posted on 2022-01-22 15:25 Angry_Panda 阅读(379) 评论(0) 编辑 收藏 举报
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
2021-01-22 并行化强化学习 —— 最终版本 —— 并行reinforce算法的尝试
2019-01-22 南京大学俞扬博士万字演讲全文:强化学习前沿(上) (转载)