逻辑回归

逻辑回归

逻辑回归是用于解决离散型的输出结果的问题(分类问题)。文本分类就是一个典型的分类问题。

在描述线性回归数学模型之前,先约定好一些表达形式: 代表输入数据 (features),代表输出数据(分类标签),代表一组训练数据(training example) ,m代表训练数据的个数,n代表特征数量。

1 逻辑回归函数表达

对于逻辑回归分类问题,y的输出等于 0 或者 1。逻辑回归函数式的输出范围是:,以0.5作为临界值(Threshhold),y的取值如下:

如果,y = 1

如果, y = 0

 

函数式表达

逻辑回归的函数表达如下:

 

其中

 

逻辑回归的损失函数是它的极大似然函数

 

逻辑回归的整个代价函数表示如下:

2 梯度下降算法

有了代价函数,接下来对于逻辑回归需要解决的事情往就是希望能够找到一组,能够最小化,即,梯度下降算法基本方式如下:

1)     随机选择一组

2)     不断的变化,让变小;

 

j=0,1,...n,是所有n+1个值同时进行变化。α 是代表学习速率。是损失函数对的偏导数。 

3)     直到寻找到最小值。

所以关键是推导出对于j的偏导数如下: 

逻辑回归的多分类:

N分类也就是训练N个二分类。对于第j个分类器,任务就是得出一个样本属于j类和其他类的概率 hθ(i)(x) 。

求得所有二分类后j(j = 1,2,3…N),那么这个样本属于的类J当:

 hθ(J)(x)  =

 

posted @ 2018-05-23 13:51  hozhangel  阅读(241)  评论(0编辑  收藏  举报