数据挖掘中决策树的探讨2
前言
数据挖掘概念
又称为数据库中的知识发现。
决策树概念
决策树方法是利用信息论中的信息增益寻找数据库中具有最大信息量的属性字段,建立决策树的一个节点,再根据该属性字段的不同取值建立树的分支。每个分支子集中重复建立树的下层结点和分支的过程。
优点:
将数据规则可视化,输出结果容易理解,精度较高。
缺点:
很难基于多个变量组合发现规则,不同决策树分支之间的分裂也不平滑。
决策树构建过程
决策树是通过一系列规则对数据进行分类的过程。
分为分类树和回归树两种,分类树对离散变量做决策树,回归树对连续变量做决策树。