逻辑回归(二分法)

数据预处理(生成虚拟变量)

 

 对于因变量为分类变量的情况,我们可以使用逻辑回归进行处理。 把y看成事件发生的概率,y>0.5表示发生;y<0.5表示不发生#

线性概率模型(Linear Probability Model,简记LPM)直接用原来的回归模型进行回归

 

 

 限制条件(两点分布--伯努利分布)

 

连接函数的取法

 

 

 

 

 logistics回归实现原理

 

SPSS求解逻辑回归

 

预测成功率

 

 

 逻辑回归系数表

 

 

表格中新添的两列解读

 

 假如自变量有分类变量的解决办法

 

 ⭐预测结果较差的解决办法

 

样本量过大会出现过拟合现象

虽然预测能力提高了,但是容易发生过拟合的现象。 对于样本数据的预测非常好,但是对于样本外 的数据的预测效果可能会很差。 (是不是和龙格现象有点相似)#

 

 如何确定适合的模型

 把数据分为训练组和测试组,用训练组(已知)的数据来估计出模型,再用测试组的数据来进行测试。(训练组和测试组的比例一般设置为80%和20%) #

例子:已知分类结果的水果ID为1‐38,前19个为苹果,后19个为橙子。 每类水果中随机抽出3个ID作为测试组,剩下的16个ID作为训练组。 (比如:17‐19、36‐38这六个样本作为测试组) 比较设置不同的自变量后的模型对于测试组的预测效果。#

(注意:为了消除偶然性的影响,可以对上述步骤多重复几次,最终对每个模型求一个平均的准确率,这个步骤称为交叉验证。)#

作者:keep--fighting

出处:https://www.cnblogs.com/keep--fighting/p/15223680.html

版权:本作品采用「署名-非商业性使用-相同方式共享 4.0 国际」许可协议进行许可。

posted @   ⭐⭐-fighting⭐⭐  阅读(533)  评论(0编辑  收藏  举报
编辑推荐:
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· AI 智能体引爆开源社区「GitHub 热点速览」
· 写一个简单的SQL生成工具
· Manus的开源复刻OpenManus初探
more_horiz
keyboard_arrow_up light_mode palette
选择主题
menu
点击右上角即可分享
微信分享提示