会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
博客园
首页
新随笔
联系
管理
2018年5月6日
机器学习_决策树及实战
摘要: 信息增益率=信息增益/自身熵值 三种方法对比: ID3的缺点,倾向于选择水平数量较多的变量,可能导致训练得到一个庞大且深度浅的树;另外输入变量必须是分类变量(连续变量必须离散化);最后无法处理空值。 C4.5选择了信息增益率替代信息增益。 CART以基尼系数替代熵;最小化不纯度而不是最大化信息增益。
阅读全文
posted @ 2018-05-06 20:15 耐烦不急
阅读(760)
评论(0)
推荐(0)
编辑
公告