作业三:CART回归树算法
【题目1】
表1为拖欠贷款人员训练样本数据集,使用CART算法基于该表数据构造决策树模型,并使用表2中测试样本集确定剪枝后的最优子树。
编号 | 房产状况 | 婚姻情况 | 年收(千元) | 拖欠贷款 |
1 | 是 | 单身 | 125 | 否 |
2 | 否 | 已婚 | 100 | 否 |
3 | 否 | 单身 | 70 | 否 |
4 | 是 | 已婚 | 120 | 否 |
5 | 否 | 高异 | 95 | 是 |
6 | 否 | 已婚 | 60 | 否 |
7 | 是 | 高异 | 220 | 否 |
8 | 否 | 单身 | 85 | 是 |
9 | 否 | 已婚 | 75 | 否 |
10 | 否 | 单身 | 90 | 是 |
编号 | 房产状况 | 婚姻情况 | 年收入(千元) | 拖欠贷款 |
1 | 否 | 已婚 | 225 | 否 |
2 | 否 | 已婚 | 50 | 是 |
3 | 否 | 单身 | 89 | 是 |
4 | 是 | 已婚 | 320 | 否 |
5 | 是 | 离异 | 150 | 是 |
6 | 否 | 离异 | 70 | 否 |
【题目2】
已知一批样本数据如下表所示,其中x为输入特征对应值,y为输出值,请建立该批数据的回归树。
x | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
y | 5.56 | 5.7 | 5.91 | 6.4 | 6.8 | 7.05 | 8.9 | 8.7 | 9 | 9.05 |
【要求】
1.以上两题写出详细的计算步骤;
2.以上两题在作业本上完成后拍照上传。