作业6-逻辑回归
1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同?
逻辑回归是一种用于解决监督学习(Supervised Learning)问题的学习算法,进行逻辑回归的目的,是使训练数据的标签值与预测出来的值之间的误差最小化。
线性bai回归要求因变量必须是连续性数据du变量;逻辑回归要求因变量必须是分类zhi变量dao,二分类或者多分类的;比如要分析性别、年龄、身高、饮食习惯对于体重的影响,如果这个体重是属于实际的重量,是连续性的数据变量,这个时候就用线性回归来做;如果将体重分类,分成了高、中、低这三种体重类型作为因变量,则采用逻辑回归。
2.自述一下什么是过拟合和欠拟合?
拟合:就是说这个曲线能不能很好的描述某些样本,并且有比较好的泛化能力。
过拟合:就是太过贴近于训练数据的特征了,在训练集上表现非常优秀,近乎完美的预测/区分了所有的数据,但是在新的测试集上却表现平平,不具泛化性,拿到新样本后没有办法去准确的判断。
3.思考一下逻辑回归的应用场景有哪些?
常用于数据挖掘,疾病自动诊断,经济预测等领域。例如,探讨引发疾病的危险因素,并根据危险因素预测疾病发生的概率等。