2021年2月20日

摘要: 节点分裂,特征选择 从概率学角度,样本集中不同样本类别分布地越均匀,说明不确定性越大,比如投掷硬币,50%正,50%负,完全不确定,而决策树模型就是需要选取特征,通过特征取值对样本进行子集划分,使得子集中的不确定性减少。 描述不确定性的算法模型:1 gini纯度 2 信息熵 两个函数都是在样本分布越 阅读全文
posted @ 2021-02-20 11:32 skyer1992 阅读(359) 评论(0) 推荐(0) 编辑

导航