orange人工智能回归问题
实验介绍:
橙现智能是一款可视化,无编程,无门槛的免费人工智能软件。
机器也可以学习,机器学习可以简单理解成总结经验,发现规律,掌握规则,预测未来。
[此处插入图片],该图片作者为未知,来源于百度,仅学习非商用。
一:软件的安装
中文版本下载地址
https://pan.baidu.com/s/1TaYQd5rAzbemBW0EFbNNZA?pwd=8ekr
提取码:8ekr,里面自带一些数据
概念先按下不表,我们直接从实操开始
二:回归问题
最近房价跌得很快,我们要怎么预测未来的房价呢?
给出历史数据,预测一个数值需要线性回归算法
why?
回归的意思是回归到平均值,举例:一个家族平均身高都是1.7m,即使有个人身高2.1m,一般来说他的子女也很难那么高。我们需要找一个模型,使它预测的值“回归”真实值。
线性的意思就是可以简单理解为直线。
数据+算法生成模型
未导入数据文件,文件上出现x
数据链接
数据处理
与结果密切相关的数据角色为“特征”,我们要预测的数据角色为“目标”,与结果无关的数据角色为“忽略”
如果我们要预测明天食堂的消费额:index(序号)与食堂消费额无关,所以角色为“忽略”;消费额是我们要预测的,所以角色为“目标”。
点击右边半弧拖出一条线,用中文或英语搜索部件
左边半弧是输入,右边半弧是输出。
数据表能让我们直观看见数据
为什么这个显示没有数据呢?
因为我们没有把文件数据输入算法
点开散点图可以看见,线性回归算法拟合的一个方程和值的对比。
为什么方程在值的点中间呢,前面我们说了回归方程是要回归到平均值的。越多点越接近直线,点越均匀分布在直线两侧,则方程拟合越好。
我们添加预测小部件利用数据和算法对未来的情况进行预测和分析
R²是1-点距离方程的距离的平方和,越接近一,代表拟合越好。
已经看见线性回归预测消费额和食堂实际消费额,但还不够可视化。怎么办呢?
添加折线图查看线性回归预测消费额和食堂实际消费额对比
制作折线图时,通常是需要先选择合适的列数据,所以我们需要选择列部件。
把线性回归和消费额作为目标
点开折线图可以看见
选择消费额按住ctrl再选线性回归,可以使两个折线在一张图上。
三:分类问题
我们怎么训练人工智能自动区分猫狗呢?
分类问题需要使用逻辑回归算法。
为什么不是线性回归算法呢?
因为线性回归算法是取平均值;假设我们有宠物的体重数据作为特征来判断是猫是狗,有些品种的猫如缅因猫体型庞大容易误判狗,有的狗体型小如吉娃娃容易误判猫还会大幅度拉低平均值,使线性方程偏离。
引用图片:已授权引用,来源《人工智能基础》耿煜 电子工业出版社 2022-07
如果线性回归方程是一条直线,逻辑回归方程则是一条曲线。
我们在文件导入三种鸢尾花的数据,训练人工智能区分不同种类的鸢尾花。
使用分布小部件 柱状图查看不同种类鸢尾花的数据分布
可以看见不同种类的鸢尾花花瓣长度差异很大
花萼宽度差异不大
混淆矩阵用于总结分类模型预测结果
紫色代表预测和实际相同的数量。红色代表预测和实际不相同的数量。
预测正确的数量是,13+13+12=38。
在测试和评分小部件查看CA,AUC
ROC分析也是越接近一越好