10 2018 档案
SGD、GD
摘要:GD参考: https://blog.csdn.net/CharlieLincy/article/details/70767791 SGD参考:https://blog.csdn.net/CharlieLincy/article/details/71082147 关于SGD,博主的第二个问题。 GD
阅读全文
决策树
摘要:参考:https://blog.csdn.net/baimafujinji/article/details/51724371 https://blog.csdn.net/baimafujinji/article/details/53239581 需要整理Gini值和熵的计算公式。ID3和C4.5的区
阅读全文
卡方分布(Chi-Square Distribution):
摘要:定义:如果我们的随机变量是标准正态分布(详见以前博客的高斯分布),那么多个随机变量的平方和服从的分布即为卡方分布。 X=Y12+Y22+⋯+Yn2 其中,Y1,Y2,⋯,Yn均为服从标准正态分布的随机变量,那么XX服从卡方分布,值得注意的是其中的nn即随机变量的个数成为卡方分布的自由度。概率密度函数
阅读全文
PCA算法数学原理及实现
摘要:数学原理参考:https://blog.csdn.net/aiaiai010101/article/details/72744713 实现过程参考:https://www.cnblogs.com/eczhou/p/5435425.html 两篇博文都写的透彻明白。 自己用python实现了一下,有几
阅读全文
PCA算法
摘要:1. 引言 降维是对数据高维度特征的一种预处理方法。降维是将高纬度的数据保留下最重要的一些特征,去除噪声和不重要的特征,从而实现提升数据处理速度的目的。在实际的生产和应用中,降维在一定的信息损失范围内,可以节省大量的时间和成本。 PCA(principal compount analysis),即主
阅读全文