摘要:
在之前的决策树算法中我们已经讲解了从数据集构造决策树算法的功能模块。 首先是创建数据集,然后计算香农熵,然后基于最好的属性值划分数据集,由于特征值可能多于两个,因此可能存在大于两个分支的数据集划分。第一次划分好之后,数据将被向下传递到树分支的一个节点,在这个节点上我们可以再次划分数据,所以我们可以采 阅读全文
摘要:
在讲了怎样构建决策树之后,作者本来还讲了如何用 Matplotlib 把决策树给画出来,噼里啪啦又是一堆代码。 但我自认为学习这部分的意义不大,毕竟这棵树长什么样子是给人看的,计算机不用考虑,能进行构建和分类就可以了。而且如果树很宽很深的话,人眼也看不过来。 所以就偷个懒,跳过这小节吧。 这篇博客讲 阅读全文
摘要:
很好。这一篇里面我们来写一些代码。 决策树可以通过递归的方式来构造。在真正建树之前,我们先来写一些子模块的代码。 计算给定数据集的熵 我们先拿个例子来做数据集吧。就是下面这个海洋生物数据: 两个特征:(1)不复出水面是否可以生存(英语:no surfacing);(2)是否有脚蹼(英语:flippe 阅读全文
摘要:
有半个月没来了。 最近一段时间...大多在忙项目组的事(其实就是改一改现有代码的bug,不过也挺费劲的,毕竟代码不是自己写的)。另外就是自己租了几台美帝的vps,搭了$-$的服务器 ,效果还不错。自己搭的话就不用去买别人的服务了,不过租vps毕竟还是要成本的,光用来番茄的话,性价比仍然比不过各路山寨 阅读全文
摘要:
写在前面的话 可怜了我这个系列的博客,写的这么好,花了很多心思去写的,却没有人知道欣赏。就像我这么好也没有人懂得欣赏,哈哈哈,我好不要脸。。。 如果您有任何地方看不懂的,那一定是我写的不好,请您告诉我,我会争取写的更加简单易懂! 如果您有任何地方看着不爽,请您尽情的喷,使劲的喷,不要命的喷,您的槽点 阅读全文
摘要:
写在前面的话 如果您有任何地方看不懂的,那一定是我写的不好,请您告诉我,我会争取写的更加简单易懂! 如果您有任何地方看着不爽,请您尽情的喷,使劲的喷,不要命的喷,您的槽点就是帮助我要进步的地方! 计算给定数据的信息熵 在决策树算法中最重要的目的我们已经在前几章说过了,就是根据信息论的方法找到最合适的 阅读全文
摘要:
目录索引 目录索引 写在前面的话 决策树构建的一般流程 数据的构建 参考链接 写在后面的话 目录索引 写在前面的话 决策树构建的一般流程 数据的构建 参考链接 写在后面的话 写在前面的话 如果您有任何地方看不懂的,那一定是我写的不好,请您告诉我,我会争取写的更加简单易懂! 如果您有任何地方看着不爽, 阅读全文
摘要:
写在前面的话 趁着现在我还是高中数理化老师,偶尔兼职英语老师的时候赶紧抓紧时间写点有关计算机科学技术的东西。一来是表示我对计算机的热爱,二来,当然是最重要的咯,满足一下我强大的虚荣心。哈哈哈哈!想想高中数学物理化学老师在折腾计算机,是不是有种瞬间吊炸天的感觉。 这个系列我写了一个月了,之后会陆陆续续 阅读全文