orange人工智能分类问题
实验介绍:
一:多分类问题
我们想要机器自动识别不同种类的生物,这就涉及到多分类问题。
支持向量机的介绍
讲得很好引用一下
支持向量机SVM详解
支持向量机和逻辑回归的区别是:逻辑回归是找一条曲线把数据分开,支持向量机就是找一个宽马路把不同类数据隔得越远越好
支持向量机对异常数据的容忍就会好一些
搭建流程
输入数据[数据链接]
(https://files.cnblogs.com/files/blogs/815873/datasets.zip?t=1730452340&download=true "数据链接")
数据是不同种类动物的腿,尾巴等的数据特征
将交叉验证改成10次,可以看见拟合非常好
使用逻辑回归算法进行对比
逻辑回归拟合更好
二:决策树
新建一个决策树的工作流,输入泰坦尼克号的生存数据,分析不同情况下的生存概率
查看树部件如其名,用来查看决策树。
决策树 叶子节点代表不同的分类,按决策规则分支。
三:集成学习
袋装
自助抽样:随机有放回地抽样。
自助抽样举例:十个红球里面放一个黑球,不管抽多少次抽到黑球概率都是1/11。
引用图片:已授权,来源《人工智能基础》耿煜 电子工业出版社 2022-07
因为是投票决定,需要模型为奇数个,否则会出现两个模型平票。
随机森林
引用图片:已授权,来源《人工智能基础》耿煜 电子工业出版社 2022-07
因为是投票决定,需要模型为奇数个。
堆叠
引用图片:已授权,来源《人工智能基础》耿煜 电子工业出版社 2022-07
提升
引用图片:已授权,来源《人工智能基础》耿煜 电子工业出版社 2022-07
工作流如下
毕达哥拉斯森林用来查看随机森林
我使用的是泰坦尼克号生存的数据