机器学习十讲-第二讲回归
1|0回归
1|1回归三大模型
- 线性回归
- 岭回归
- LASSO回归
1|2使用回归模型预测鲍鱼年龄
一、导入数据,进行分析
可以看出鲍鱼有9个特征
每个特征所对应的数据代表的含义是:
数据集一共有 4177 个样本,每个样本有 9 个特征。其中 rings
为鲍鱼环数,能够代表鲍鱼年龄,是预测变量。除了 sex
为离散特征,其余都为连续变量。
首先借助 seaborn
中的 countplot
函数绘制条形图,观察 sex
列的取值分布情况。
对于连续特征,可以使用 seaborn
的 distplot
函数绘制直方图观察特征取值情况。我们将 8 个连续特征的直方图绘制在一个 4 行 2 列的子图布局中。
也可以通过,热力图来展示性别对其他特征的影响
为了定量地分析特征之间的线性相关性,我们计算特征之间的相关系数矩阵,并借助热力图将相关性可视化。
二、鲍鱼数据预处理
对 sex
特征进行 OneHot 编码
添加取值为 1 的特征(若是用sklearn中的linear_model里的回归函数,则不必添加)
根据鲍鱼环计算年龄
一般每过一年,鲍鱼就会在其壳上留下一道深深的印记,这叫生长纹,就相当于树木的年轮。在本数据集中,我们要预测的是鲍鱼的年龄,可以通过环数 rings
加上 1.5 得到。
构造两组特征集
将鲍鱼数据集划分为训练集和测试集
1|3实现线性回归和岭回归
构建自己的线性回归方程
使用sklearn里的线性方程
这里所用的训练集的参数:是不包含ones那一列的
可见结果值相同,我们使用 Numpy
实现的线性回归模型与 sklearn
得到的结果是一致的。
构建自己的岭回归方程
使用sklearn里的岭回归方程
使用 LASSO 构建鲍鱼年龄预测模型
1|4鲍鱼年龄预测模型效果评估
可以看出:岭回归和线性回归比较好
可以看出三者都不好,岭回归相对好
__EOF__
作 者:清风紫雪
出 处:https://www.cnblogs.com/xiaofengzai/p/14349711.html
关于博主:编程路上的小学生,热爱技术,喜欢专研。评论和私信会在第一时间回复。或者直接私信我。
版权声明:署名 - 非商业性使用 - 禁止演绎,协议普通文本 | 协议法律文本。
声援博主:如果您觉得文章对您有帮助,可以点击文章右下角【推荐】一下。您的鼓励是博主的最大动力!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构
2020-01-30 ImageSwitcher和GridView的案例开发
2020-01-30 双指针,BFS与图论(一)