随笔分类 - python 大战机器学习 读书笔记
第95:PCA
摘要:输入数据矩阵->计算每条记录的平均值和标准差->计算协方差矩阵->得到协方差矩阵的所有特征值和特征向量->对特征值进行从大到小的排序,并且得到与之对应的特征向量 PCA是无监督的。没有标签也可以做,是基于方差的。 精髓在于将协方差矩阵进行相似对角化,是主对角线上的值尽可能的大,其余位置尽可能的小。
阅读全文
第98:svd原理
摘要:SVD分解:任何矩阵都可以分解成第一行的形式,3个相乘。UV都是正交矩阵,中间的是奇异值。 3个相乘的形式可以拆分。即奇异值*第一行*第一列。在相加。 奇异值有时很小,在这种情况下,丢掉,可以减少计算量,也可以减少一些噪声。
阅读全文
第二章 决策树
摘要:补充知识点一:决策树 转自:https://www.cnblogs.com/pinard/p/6053344.html 转自:https://weizhixiaoyi.com/2018/04/19/机器学习之决策树-C4-5算法/
阅读全文
第一章 线性模型
摘要:恢复内容开始 个人认为算法是错误的。 在for循环中 alpha与rho顺序反了,故后来的reshape操作是错的。 下面举个例子帮助理解: 补充知识一:什么是最小二乘法 总结: 一.背景 5月9号到北大去听hulu的讲座《推荐系统和计算广告在视频行业应用》,想到能见到传说中的项亮大神,特地拿了本《
阅读全文