|NO.Z.00008|——————————|BigDataEnd|——|Arithmetic&Machine.v08|——|Machine:监督学习算法.v07|
一、决策树的算法评价
### --- 决策树的算法评价
~~~ # 决策树优点
~~ 易于理解和解释,因为树木可以画出来被看见。
~~ 需要很少的数据准备。其他很多算法通常都需要数据规范化,需要创建虚拟变量并删除空值等。
~~~ 但请注意,sklearn 中的决策树模块不支持对缺失值的处理。
~~ 使用树的成本(比如说,在预测数据的时候)是用于训练树的数据点的数量的对数,
~~~ 相比于其他算法,这是一个很低的成本。
~~ 能够同时处理数字和分类数据,既可以做回归又可以做分类。
~~~ 其他技术通常专门用于分析仅具有一种变量类型的数据集。
~~ 即使其假设在某种程度上违反了生成数据的真实模型,也能够表现良好。
### --- 决策树缺点
~~~ # 使用决策树可能创建过于复杂的树,这些树不能很好地推广数据。这称为过度拟合。
~~~ 修剪,设置 叶节点所需的最小样本数或设置树的最大深度等机制是避免此问题所必需的,
~~~ 而这些参数的整合和调整对 初学者来说会比较晦涩。
~~~ # 决策树可能不稳定,数据中微小的变化可能导致生成完全不同的树,
~~~ 这个问题需要通过集成算法来解决。
~~~ # 决策树的学习是基于贪婪算法,它靠优化局部最优(每个节点的最优)来试图达到整体的最优,
~~~ 但这种做法不能保证返回全局最优决策树。这个问题也可以由集成算法来解决,
~~~ 在随机森林中,特征和样本会在分枝过程中被随机采样。
~~~ # 如果标签中的某些类占主导地位,决策树学习者会创建偏向主导类的树。
~~~ 因此,建议在拟合决策树之前平衡数据集。
Walter Savage Landor:strove with none,for none was worth my strife.Nature I loved and, next to Nature, Art:I warm'd both hands before the fire of life.It sinks, and I am ready to depart
——W.S.Landor
分类:
bdv029-算法
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· DeepSeek 开源周回顾「GitHub 热点速览」