20210131

今天的部分是数据降维。讲解的是PCA和自编码器。就如其名,数据降维就是降低数据的维度。实际获取的数据中可能维度很多,而其中更是有很多的数据可能存在线性关系造成的冗余等。个人理解的数据降维就是将数据的维度降低,提取出“最有代表性的N个维度”。PCA算法本身就是求数据矩阵的特征向量和特征值,然后根据设定的N选取特征向量从大到小排列的前N个特征向量组成转换矩阵。而讲解的第二种方法是自编码器。自编码器是一种特殊的神经网络,原本目的是将输入复制到输出。而当隐含层的神经元数量小于输入层时,隐含层的输出亦可作为降维之后的结果。上述第二种算法虽然没有结果但仍然是一种有监督的机器学习(第一种单纯是作为一个算法),算法的评判就是将降维之后的数据还原成原始维度之后与原数据之间的差异。

posted @ 2021-01-31 14:08  水無月鈴乃  阅读(56)  评论(0编辑  收藏  举报