Fork me on GitHub

人工智能之机器学习基础——决策树（Decision Tree）

决策树是一种用于分类和回归的非参数模型，能够通过一系列的条件判断（分裂规则）将输入数据划分为子区域，从而完成预测任务。

1. 决策树的基本结构

决策树由以下三部分组成：

根节点（Root Node）：
- 表示整个数据集，最初没有任何划分。
内部节点（Internal Node）：
- 表示一个特定的特征测试条件（例如： $x1>5x_1 > 5x1>5）。$
- 根据测试结果将数据划分为多个子节点。
叶节点（Leaf Node）：
- 表示最终的分类或回归输出。
- 分类任务中，叶节点存储类别标签；
- 回归任务中，叶节点存储预测的值（如平均值）。

决策路径：

从根节点到叶节点的一条路径，代表了一系列的决策规则。

3. 决策树的优缺点

3.1 优点

简单直观：
- 决策树易于理解和解释，适合可视化。
无需特征缩放：
- 对数据的缩放或标准化不敏感。
处理非线性关系：
- 决策树能够自动划分非线性边界。
多用途：
- 同时适用于分类和回归任务。

3.2 缺点

过拟合：
- 决策树容易生成过于复杂的树，从而在训练集上表现很好，但在测试集上泛化能力较差。
不稳定性：
- 数据的微小变化可能导致树结构的显著变化。
倾向于划分较多的特征：

决策树可能偏好取值范围多的特征。

4. 决策树的正则化方法

为了防止过拟合，可以对决策树进行正则化：

最大深度（max_depth）：
- 限制树的深度，防止树过于复杂。
最小样本分割（min_samples_split）：
- 控制每次分裂所需的最小样本数。
最小样本叶节点（min_samples_leaf）：
- 控制叶节点中的最小样本数。
剪枝（Pruning）：
- 后剪枝：先生成完全的树，再对其进行剪枝；
- 预剪枝：在构建过程中提前停止分裂。

5. 决策树的扩展

5.1 随机森林（Random Forest）

随机森林由多个决策树组成，是一种基于集成学习的模型。
每棵树在训练时随机选择一部分特征，最终通过投票（分类）或平均（回归）得到结果。

5.2 梯度提升树（Gradient Boosted Tree, GBT）

使用多个决策树，按梯度提升的方式逐步减小模型误差。

5.3 极端随机树（Extra Tree）

在决策树的基础上引入更多随机性，例如随机选择分裂点。

6. 决策树分类任务示例

问题描述

我们有一个小型数据集，目标是预测一个人是否适合参加户外运动（"是" 或 "否"），特征包括天气、温度和风速。数据如下：

天气	温度	风速	是否适合运动
晴天	热	强	否
晴天	热	弱	否
多云	热	强	是
雨天	温暖	强	是
雨天	冷	强	否
雨天	冷	弱	是
多云	冷	弱	是
晴天	温暖	强	否
晴天	冷	弱	是
雨天	温暖	弱	是

目标是构建一棵决策树来预测“是否适合运动”。

　　　　　　　　

posted @ 2024-11-19 21:47 z_s_s 阅读(258) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

公告

Live2D

欢迎阅读『人工智能之机器学习基础——决策树（Decision Tree）』

昵称： z_s_s
园龄： 6年
粉丝： 2
关注： 2

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔档案

相册

forkme(1)

阅读排行榜

评论排行榜

1. 人工智能之深度学习基础——反向传播（Backpropagation）(2)

推荐排行榜

1. 人工智能之深度学习基础——反向传播（Backpropagation）(1)

最新评论

1. Re:人工智能之深度学习基础——反向传播（Backpropagation）
@今天也要多学一点欢迎光临！...
--z_s_s
2. Re:人工智能之深度学习基础——反向传播（Backpropagation）
感谢分享！此外，老师您的博客界面的神经元动效也特别好玩儿....一直玩了两分钟hhh
--今天也要多学一点