02 2021 档案

摘要:LDA是什么 隐含狄利克雷分布(Latent Dirichlet Allocation,以下简称LDA),是由Blei, David M.、Ng, Andrew Y.、Jordan于2003年提出的一种主题模型,是一种无监督机器学习技术,它可以将文档集中每篇文档的主题以概率分布的形式给出,从而通过分 阅读全文
posted @ 2021-02-09 23:12 1033020837 阅读(297) 评论(0) 推荐(0) 编辑
摘要:特征选择的目标 构造机器学习的模型的目的是希望能够从原始的特征数据集中学习出问题的结构与问题的本质,此时的挑选出的特征就应该能够对问题有更好的解释;特征决定了机器学习的上限,而模型和算法只是去逼近这个上限,所以特征选择的目标大概如下: 提高预测的准确性; 减少模型的运行时间; 能够对模型有更好的理解 阅读全文
posted @ 2021-02-03 15:57 1033020837 阅读(295) 评论(0) 推荐(0) 编辑
摘要:数据降维简介 数据降维即对原始数据特征进行变换,使得特征的维度减少。 依据降维过程是否可以用一个线性变换表示,降维算法可以分为线性降维算法和非线性降维算法,下图展示了各种降维算法及其类别: 降维的必要性: 多重共线性和预测变量之间相互关联。多重共线性会导致解空间的不稳定,从而可能导致结果的不连贯。 阅读全文
posted @ 2021-02-02 22:03 1033020837 阅读(708) 评论(0) 推荐(0) 编辑