逻辑回归
一、定义
线性回归是连续性预测,但是有时候要进行分类,此时可以用逻辑回归输出标记(逻辑回归分析是对定性变量的回归分析。在前面学到的回归模型中,我们处理的因变量都是数值型区间变量,建立的模型描述的是因变量的期望与自变量之间的线性关系。)
二、定性变量
定性变量是统计学的概念,又名分类变量 ,观测的个体只能归属于几种互不相容类别中的一种时,一般是用非数字来表达其类别,这样的观测数据称为定性变量。
三、定量变量
定量变量也就是通常所说的连续量,如长度、重量、产量、人口、速度和温度等,它们是由测量或计数、统计所得到的量,这些变量具有数值特征,称为定量变量。
四、区别
定性变量并非真有数量的变化,而只有性质上的差异。定量变量具有数值特征。
1、线性回归公式
逻辑回归对线性回归结果使用单位阶跃函数进行函数映射,使z的值为0/1值:
逻辑回归对线性回归结果使用sigmod函数进行了函数映射,使z的值接近0或1:
进一步变化:
,y就相当于预测为正例的概率,1-y就相当于预测为反例的概率。
2、逻辑回归模型