随笔档案「2018年10月26日」：D3算法编写决策树 ... - Red_Code

2018年10月26日

摘要：前言所谓构建决策树，就是递归的对数据集参数进行“最优特征”的选择。然后按最优特征分类成各个子数据集，继续递归。最优特征的选择：依次计算按照各个特征进行分类以后数据集的熵，各个子数据集的熵比较后，其中拥有最小的熵的数据集就是最优的分类结果，此次分类的特征就是最优特征。熵的计算：熵计算的是数据集阅读全文

posted @ 2018-10-26 15:10 Red_Code 阅读(1157) 评论(0) 推荐(0)

Red_Code

万载青史过云烟，孤灯绯墨浮沉现。止水寒窗磨砺出，定心锋卧天地间。