代码改变世界

6.逻辑回归

2020-04-26 11:37  广商吴彦祖  阅读(199)  评论(0编辑  收藏  举报

1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同?

逻辑回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。

线性回归要求因变量必须是连续性数据变量;逻辑回归要求因变量必须是分类变量,二分类或者多分类的

2.自述一下什么是过拟合和欠拟合?

过拟合是在模型参数拟合过程中的问题,由于训练数据包含抽样误差,训练时,复杂的模型将抽样误差也考虑在内,将抽样误差也进行了很好的拟合。一味追求提高对训练数据的预测能力,所得到模型的复杂度往往比真实模型要高。具体表现就是所得到的模型训练误差很低,但是在测试集上表现差,即模型的泛化能力弱。

欠拟合通常是由于学习器的学习能力不足,样本不够或者算法不精确,测试样本特性没有学到,不具泛化性,拿到新样本后没有办法去准确的判断。

 

 

3.思考一下逻辑回归的应用场景有哪些?

  用于分类:适合做很多分类算法的基础组件。

  用于预测:预测事件发生的概率(输出)。

  用于分析:单一因素对某一个事件发生的影响因素分析(特征参数值)。