27.t分布随机近邻嵌入t-SNE

t分布随机近邻嵌入(t-distributed Stohastic Neighbor Embedding)

基本思路:为高维特征空间在二维平面(或三维超平面,不过基本上总是使用二维空间)上寻找一个投影,使得在原本的n维空间中相距很远的数据点在屏幕上同样相距较远,而原本相近的点在平面上仍然相近。本质上,近邻嵌入寻找保留了样本的邻居关系的新的维度较低的数据表示。

 

参数:

  • perplexity 困惑度
  • step 迭代次数
  • epsilon 学习率

 

 

参考文献:

【1】机器学习开放课程:二、使用Python可视化数据

【2】高维数据可视化之t-SNE算法🌈 - 知乎(理论推导+实验)

posted @ 2019-06-27 10:13  nxf_rabbit75  阅读(809)  评论(0编辑  收藏  举报