机器学习和 Python 中的决策树算法

→ 决策树是一种树形算法，用于确定行动过程，树的每个分支代表一个可能的决策、发生或反应。

让我们看一下术语：-

熵——熵是数据集中“随机性”或“杂质”的度量。

熵应该很低！

信息增益——它是数据集拆分后熵减少的度量，也称为熵减少。

信息增益应该很高！

叶节点——叶节点承载分类或决策。

根节点——最顶层的决策节点被称为根节点。

示例：- 决策树如何工作？

假设你妈妈告诉你去超市带些口粮。让我们来看看 ;

问题陈述：-根据特征对所有口粮进行分类。

这是清单：大米、小麦、豆类、盐、糖、姜黄粉

让我们确定这个人是否带来了正确的东西。

训练数据集：-

我们必须以信息增益最高的方式构建分割数据的条件。

现在，如果我们看看我们的树；

由于，现在每个分支都包含单个标签类型，我们可以说这种情况下的熵已达到最小值。

这棵树现在可以最准确地预测数据集中存在的所有动物类别。

— — — — — — — — — — — — — — — — — — — — — — — — — — — — — —

这就是这篇文章的全部内容，我知道我已经计算了熵和信息增益，对此我很抱歉，但我很快就会在 insha'Allah 上做，还有一些其他的例子。

如果有任何错误请纠正我，我会很高兴学习。

快乐学习！

我的领英不要犹豫，联系我 😃

谢谢你。

posted @ 2022-08-31 03:11 哈哈哈来了啊啊啊阅读(30) 评论(0) 收藏举报

刷新页面返回顶部

amboke