机器学习之逻辑回归(分类)
线性回归的输出值的范围通常是无法限定的。逻辑回归通过(sigmoid函数)将其转化为(0,1)区间的数值。
逻辑回归可以被理解为时一个被sigmoid函数归一化后的线性回归,也可以被视为一种广义线性模型。
逻辑回归应用举例:垃圾短信分类。可以使用TF-IDF来抽取短信的特征向量,然后用逻辑回归分类:
1.如果逻辑回归响应变量等于超过指定的临界值(如0.5),预测结果就是正例,否则为反例。
开发流程:
1.提出假设函数:就是在线性回归的假设函数外,套一层sigmoid函数
2.提出损失函数(一个样本的误差):对数损失函数
3.提出代价函数(整个样本集的误差):
4.计算代价函数的最小值。的到对应的w
5.将w带入到假设函数做预测
什么样的函数可以当损失函数?
损失函数:评估真实值与预测值之间的差异,且当损失函数值越小的时候,预测值一定要接近真实值。
·在逻辑回归中,损失函数使用的叫做对数损失函数,对数损失函数不能用做与线性回归,只能用于逻辑回归。