机器学习和 Python 中的决策树算法
机器学习和 Python 中的决策树算法
→ 决策树是一种树形算法,用于确定行动过程,树的每个分支代表一个可能的决策、发生或反应。
让我们看一下术语:-
熵——熵是数据集中“随机性”或“杂质”的度量。
熵应该很低!
信息增益——它是数据集拆分后熵减少的度量,也称为熵减少。
信息增益应该很高!
叶节点——叶节点承载分类或决策。
根节点——最顶层的决策节点被称为根节点。
示例:- 决策树如何工作?
假设你妈妈告诉你去超市带些口粮。让我们来看看 ;
问题陈述:-根据特征对所有口粮进行分类。
这是清单:大米、小麦、豆类、盐、糖、姜黄粉
让我们确定这个人是否带来了正确的东西。
- 数据集非常混乱,在这种情况下熵很高。
训练数据集:-
我们必须以信息增益最高的方式构建分割数据的条件。
现在,如果我们看看我们的树;
由于 ,现在每个分支都包含单个标签类型,我们可以说这种情况下的熵已达到最小值。
这棵树现在可以最准确地预测数据集中存在的所有动物类别。
— — — — — — — — — — — — — — — — — — — — — — — — — — — — — —
这就是这篇文章的全部内容,我知道我已经计算了熵和信息增益,对此我很抱歉,但我很快就会在 insha'Allah 上做,还有一些其他的例子。
如果有任何错误请纠正我,我会很高兴学习。
快乐学习!
我的 领英 不要犹豫,联系我 😃
谢谢你。
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· DeepSeek 开源周回顾「GitHub 热点速览」