逻辑回归和正规化

逻辑回归(logistic regression)

1.用来解决归类问题（只是由于历史上的原因取了回归的名字）

2.二分归类（binary classification）

定义：对于输入，输出值不连续，而是两个离散的值，eg:{0,1}
方法：利用线性回归，将大于0.5的输出预测值设为1，小于0.5的输出预测值设为0.（目前不可行，因为归类问题不是线性函数，所以引入S型函数(Sigmoid Function)/逻辑函数(logistic function)）
Sigmoid Function / logistic function

z>=0时g>=0.5,z<0时g<0.5； z-> -∞,g->0； z-> +∞,g->1

, ,

h(x)为输出值为1的概率：

为了得到离散的归类，假设：

，所以有：

决策边界(decision boundry):将y=0和y=1的区域分开的那条线（对应上面来说就是θ'x=0那个方程）
代价方程(cost function):

合并上面两个式子:

再向量化表示：

画图是：

梯度下降(gradient decent):

求偏导可得：（和之前线性回归的结果一样）

向量化表示为：

比梯度下降更优的求θ的方法：

　　　Conjugate gradient, BFGS, L-BFGS

用octave内部的函数库来调用这些方法，步骤：

    1.写出代价函数和它的偏导：

　　 function [jVal, gradient] = costFunction(theta)
  　　 jVal = [...code to compute J(theta)...];
  　　 gradient = [...code to compute derivative of J(theta)...];
　　 end
    2.调用fminunc函数，optimset是传给该函数的参数

　　 options = optimset('GradObj', 'on', 'MaxIter', 100);
　　 initialTheta = zeros(2,1);
　　 [optTheta, functionVal, exitFlag] = fminunc(@costFunction, initialTheta, options);

3.多类归类（multiclass classification）: