2017 年 8月 23 日随笔档案 - 郑哲

2017年8月23日

摘要：我们通过PCA把二维数据降到一维。那么怎么把一维数据变回二维通过X=UZ 我们得到的点都在z轴上这个X十分解决x了如何去选择k值 PCA的成本函数：总变差（这些x长度的平方均值）: 意味这我的平均向量离0向量有多远我们选择k使下面的公式成立：使得99%差异性得到保留除了0.01，人们阅读全文

posted @ 2017-08-23 16:29 郑哲阅读(569) 评论(0) 推荐(0) 编辑

主成分分析法（PCA）

摘要：比如说我们有两个特征变量，我们想让他变成一个变量首先我们画一条线，做各个点到这条线上的投影，箭头所指的蓝色线段为投影误差，PCA不会选择红色这条线投影，因为投影误差太大了。所以PCA的目标是使投影误差最小化 PCA和线性回归的区别线性回归的误差来自竖直方向，而PCA的误差来自垂直方向 PCA 阅读全文

posted @ 2017-08-23 15:09 郑哲阅读(343) 评论(0) 推荐(0) 编辑

数据降维和可视化

摘要：当有两个特征变量为厘米和英尺时，我们可以把两个特征变量降为1个两个变量的值几乎呈线性关系，相关性很强于是得到下图的新的变量：同样可以把3维降到2维：维数约减同样可以用在高维度。数据可视化当我没有大量变量，比如有50个我们可以用维数减约来降到两维从而使数据可视化阅读全文

posted @ 2017-08-23 14:36 郑哲阅读(615) 评论(0) 推荐(0) 编辑