摘要: 基础概念 主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。 原理: 在用统计分析方法研究多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数 阅读全文
posted @ 2017-01-15 16:54 molearner 阅读(11345) 评论(0) 推荐(0) 编辑
摘要: 决策树基础概念 在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。Entropy (熵) 表示的是系统的凌乱程度,它是决策树的决策依据,熵的概念来源于香侬的信息论。 决策树的决策过程 选择分裂特征:根据某一指标(信息增益,信息增益比或基尼系数)计算不同特征的指标值,选 阅读全文
posted @ 2017-01-15 14:49 molearner 阅读(7926) 评论(0) 推荐(0) 编辑