6.逻辑归回
1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同?
答:逻辑回归(Logistic Regression)是用于处理因变量为分类变量的回归问题,常见的是二分类或二项分布问题,也可以处理多分类问题,它实际上是属于一种分类方法。
区别:
线性回归假设响应变量服从正态分布,逻辑回归假设响应变量服从伯努利分布
逻辑回归与线性回归都是一种广义线性模型,输入都是一样的,但逻辑回归的结果是一个二分类问题。
逻辑回归处理的是分类问题,线性回归处理的是回归问题,这也导致了两个模型的取值范围不同:0-1和实数域
2.自述一下什么是过拟合和欠拟合?
欠拟合:
当模型复杂度很低时,测试误差和训练误差的损失值很高,这就是欠拟合。比如说你丢给计算机一些天鹅的属性让他预测,由于给的数据样本太少,所以计算机也可能会把鸭子认为天鹅,这便是欠拟合。
过拟合
过拟合成因是给定的数据集相对过于简单,使得模型在拟合函数时过分地考虑了噪声等不必要的数据间的关联。或者说相对于给定数据集,模型过于复杂、拟合能力过强。
3.思考一下逻辑回归的应用场景有哪些?
(1)广告点击率;
(2)是否为垃圾邮件;
(3)是否患病;
(4)金融诈骗;
(5)虚假账号