27.t分布随机近邻嵌入t-SNE
t分布随机近邻嵌入(t-distributed Stohastic Neighbor Embedding)
基本思路:为高维特征空间在二维平面(或三维超平面,不过基本上总是使用二维空间)上寻找一个投影,使得在原本的n维空间中相距很远的数据点在屏幕上同样相距较远,而原本相近的点在平面上仍然相近。本质上,近邻嵌入寻找保留了样本的邻居关系的新的维度较低的数据表示。
参数:
- perplexity 困惑度
- step 迭代次数
- epsilon 学习率
参考文献:
【2】高维数据可视化之t-SNE算法🌈 - 知乎(理论推导+实验)