06 2023 档案
摘要:有了第九课SVD分解的基础,PCA降维的原理理解起来就比较容易了。 1、PCA降维原理 先回到SVD分解,对矩阵A进行SVD分解,得到下式: A = U * S * V 其中V是正交矩阵,即V*VT=E,对上式进行一下转化: A * VT = U * S * V * VT A * VT = U *
阅读全文
摘要:大学里的《线性代数》学过矩阵的加减乘法操作,计算起来也比较简单,比如现有矩阵A和B,取值如下: A是2*3的矩阵,B是3*2的矩阵,C很容易求得一个2*2的矩阵: 上面的计算过程,相信很多人都会,但现在的问题,如何求矩阵C由哪些矩阵相乘而得?这个问题估计会的人就不多了,其实这是一个矩阵分解的问题,也
阅读全文
摘要:市面上常用的机器学习算法,也就剩下KNN、朴素贝叶斯、决策树、随机森林这些算法了,这些算法各有优劣,适用不同的场景,没有谁能把所有其他的算法干掉而统一天下。 下面将通过准确率、耗时两个维度,来对比KNN、朴素贝叶斯、决策树、随机森林这几个算法的性能。 1、构建数据集,并拆分为训练集和测试集 调用Sk
阅读全文
摘要:1、算法概述 随机森林是一种集成学习方法,其理论基础是决策树。 随机森林由随机+森林两个词组成,这两个词非常精确的描述了随机森林算法的本质,随机说明了算法具有一定的随机性,体现在算法在选取数据集时,会随机从行和列两个方向筛选出子样本,比如图1和图2显示了随机森林两棵子树A和B所选取的数据集是不同的,
阅读全文