orange人工智能分类问题

实验介绍:

一:多分类问题

我们想要机器自动识别不同种类的生物,这就涉及到多分类问题。

支持向量机的介绍

讲得很好引用一下
支持向量机SVM详解
支持向量机和逻辑回归的区别是:逻辑回归是找一条曲线把数据分开,支持向量机就是找一个宽马路把不同类数据隔得越远越好
支持向量机对异常数据的容忍就会好一些
image

搭建流程
image
输入数据[数据链接]
(https://files.cnblogs.com/files/blogs/815873/datasets.zip?t=1730452340&download=true "数据链接")
数据是不同种类动物的腿,尾巴等的数据特征
image

将交叉验证改成10次,可以看见拟合非常好
image
image

使用逻辑回归算法进行对比

image
逻辑回归拟合更好
image

二:决策树

新建一个决策树的工作流,输入泰坦尼克号的生存数据,分析不同情况下的生存概率
image
image
查看树部件如其名,用来查看决策树。

决策树 叶子节点代表不同的分类结果,按决策规则分支。

image
image
image

三:集成学习

袋装

自助抽样:随机有放回地抽样。
自助抽样举例:十个红球里面放一个黑球,不管抽多少次抽到黑球概率都是1/11。
image

引用图片:已授权,来源《人工智能基础》耿煜 电子工业出版社 2022-07

因为是投票决定,需要模型为奇数个,否则会出现两个模型平票。

随机森林

image

引用图片:已授权,来源《人工智能基础》耿煜 电子工业出版社 2022-07

因为是投票决定,需要模型为奇数个。

堆叠

image

引用图片:已授权,来源《人工智能基础》耿煜 电子工业出版社 2022-07

提升

image

引用图片:已授权,来源《人工智能基础》耿煜 电子工业出版社 2022-07

工作流如下
毕达哥拉斯森林用来查看随机森林
image
我使用的是泰坦尼克号生存的数据
image
image

posted on 2024-10-31 20:24  纤秾  阅读(55)  评论(0编辑  收藏  举报