逻辑回归(二分法)
数据预处理(生成虚拟变量)
对于因变量为分类变量的情况,我们可以使用逻辑回归进行处理。 把y看成事件发生的概率,y>0.5表示发生;y<0.5表示不发生#
线性概率模型(Linear Probability Model,简记LPM)直接用原来的回归模型进行回归
限制条件(两点分布--伯努利分布)
连接函数的取法
logistics回归实现原理
SPSS求解逻辑回归
预测成功率
逻辑回归系数表
表格中新添的两列解读
假如自变量有分类变量的解决办法
⭐预测结果较差的解决办法
样本量过大会出现过拟合现象
虽然预测能力提高了,但是容易发生过拟合的现象。 对于样本数据的预测非常好,但是对于样本外 的数据的预测效果可能会很差。 (是不是和龙格现象有点相似)#
如何确定适合的模型
把数据分为训练组和测试组,用训练组(已知)的数据来估计出模型,再用测试组的数据来进行测试。(训练组和测试组的比例一般设置为80%和20%) #
例子:已知分类结果的水果ID为1‐38,前19个为苹果,后19个为橙子。 每类水果中随机抽出3个ID作为测试组,剩下的16个ID作为训练组。 (比如:17‐19、36‐38这六个样本作为测试组) 比较设置不同的自变量后的模型对于测试组的预测效果。#
(注意:为了消除偶然性的影响,可以对上述步骤多重复几次,最终对每个模型求一个平均的准确率,这个步骤称为交叉验证。)#
作者:keep--fighting
出处:https://www.cnblogs.com/keep--fighting/p/15223680.html
版权:本作品采用「署名-非商业性使用-相同方式共享 4.0 国际」许可协议进行许可。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· winform 绘制太阳,地球,月球 运作规律
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· AI 智能体引爆开源社区「GitHub 热点速览」
· 写一个简单的SQL生成工具
· Manus的开源复刻OpenManus初探