关闭页面特效

机器学习十讲-第二讲回归

1|0回归


1|1回归三大模型


  • 线性回归
  • 岭回归
  • LASSO回归

 

1|2使用回归模型预测鲍鱼年龄


一、导入数据,进行分析

 

 可以看出鲍鱼有9个特征

每个特征所对应的数据代表的含义是:

 

 数据集一共有 4177 个样本,每个样本有 9 个特征。其中 rings 为鲍鱼环数,能够代表鲍鱼年龄,是预测变量。除了 sex 为离散特征,其余都为连续变量。

首先借助 seaborn 中的 countplot 函数绘制条形图,观察 sex 列的取值分布情况。

 

 对于连续特征,可以使用 seaborn 的 distplot 函数绘制直方图观察特征取值情况。我们将 8 个连续特征的直方图绘制在一个 4 行 2 列的子图布局中。

 

 也可以通过,热力图来展示性别对其他特征的影响

 

 为了定量地分析特征之间的线性相关性,我们计算特征之间的相关系数矩阵,并借助热力图将相关性可视化。

 

 

二、鲍鱼数据预处理

对 sex 特征进行 OneHot 编码

添加取值为 1 的特征(若是用sklearn中的linear_model里的回归函数,则不必添加)

根据鲍鱼环计算年龄

一般每过一年,鲍鱼就会在其壳上留下一道深深的印记,这叫生长纹,就相当于树木的年轮。在本数据集中,我们要预测的是鲍鱼的年龄,可以通过环数 rings 加上 1.5 得到。

构造两组特征集

将鲍鱼数据集划分为训练集和测试集

1|3实现线性回归和岭回归


构建自己的线性回归方程

 

 

 

 

 使用sklearn里的线性方程

这里所用的训练集的参数:是不包含ones那一列的

 

 可见结果值相同,我们使用 Numpy 实现的线性回归模型与 sklearn 得到的结果是一致的。

构建自己的岭回归方程

 

 

 

 

 使用sklearn里的岭回归方程

使用 LASSO 构建鲍鱼年龄预测模型

 

 

1|4鲍鱼年龄预测模型效果评估


 

可以看出:岭回归和线性回归比较好

 

可以看出三者都不好,岭回归相对好

 

 

 


__EOF__

作  者清风紫雪
出  处https://www.cnblogs.com/xiaofengzai/p/14349711.html
关于博主:编程路上的小学生,热爱技术,喜欢专研。评论和私信会在第一时间回复。或者直接私信我。
版权声明:署名 - 非商业性使用 - 禁止演绎,协议普通文本 | 协议法律文本
声援博主:如果您觉得文章对您有帮助,可以点击文章右下角推荐一下。您的鼓励是博主的最大动力!

posted @   清风紫雪  阅读(457)  评论(0编辑  收藏  举报
编辑推荐:
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构
历史上的今天:
2020-01-30 ImageSwitcher和GridView的案例开发
2020-01-30 双指针,BFS与图论(一)
0
0
关注
跳至底部
点击右上角即可分享
微信分享提示