【机器学习】逻辑回归的C++实现

代码框架与感知机一致，区别仅在于train和test函数上。

train

逻辑回归和感知机一样，也是来解决二分类问题。但输出的为当前标签为1的概率，所以和感知机只训练错误样例不同，我们需要对每个样本进行训练。

我们需要的输出范围为[0, 1]，但是线性方程\(f(x) = wx + b\)的范围为负无穷到正无穷，所以我们要对输出进行变化（感知机的变换函数为符号函数）。于是我们使用sigmoid函数，sigmoid除了能够将输入调整到0到1的功能外，还具备很好的导数性质。sigmoid函数表示为：

\[f(z)=\frac{1}{1 + e^{-z}} \]

则逻辑回归的整体数学形式为：

\[y = \frac{1}{1 + e^{-wx}} \]

输出的值为样本为1的概率，为了方便后续计算，我们将其设为\(p\)，即：

\[P(y=1 \mid x)=p=\frac{1}{1 + e^{-wx}} \]

上式对\(w\)求导，可以得到\(p'=p(1-p)x\)，其导数形式也非常简单，有利于后续的参数更新。

在当前\(w\)参数下，对于任意输入样本，逻辑回归的预测结果概率可以表示为：

\[P(y \mid x)=\left\{\begin{array}{r} p, \quad y=1 \\ 1-p, \quad y=0 \end{array}\right. \]

综合起来可以写为：

\[P(y \mid x)=p^{y}(1-p)^{1-y} \]

我们要求得一组\(w\)参数，使当前抽样样本发生的概率最大，也就是取极大似然估计，再加上负号就可以定义为逻辑回归的损失函数。所以我们对所有概率连乘，两边取log变成连加，再取负号，得到逻辑回归的损失函数：

\[F(x)=-\sum{ylogp + (1-y)log(1-p)} \]

得到目标函数后，我们对\(w\)求偏导，得\(w\_delta[i] = -(y[i]-p[i])x[i]\)。我们使用随机梯度下降的方法，每次输入样本后都能更新\(w = w - h * w\_delta\)。

void train(int itera) {
    int m = train_set.size();
    int n = train_set[0].size();
    w.assign(n + 1, 0); // w与b合并，维度+1
    double h = 0.0001;
    for (int i = 0; i < itera; i++) { // 开始迭代
        for (int j = 0; j < m; j++) {
            Vec xi = train_set[j]; // 当前训练数据，一维向量
            double yi = train_label[j]; // 当前label
            double exp_wx = exp(mul_vv(w, xi)); // 先计算好，避免重复运算
            Vec w_delta = mul_vd(xi, h * (yi - exp_wx / (1 + exp_wx))); // 计算w更新值
            w = add_vv(w, w_delta); // 更新w
        }
    }
}

test

测试时，只需要计算预测为1的概率p即可。p>=0.5则预测为1，否则预测为0。

double test() {
    int m = test_set.size();
    int n = test_set[0].size();
    double err_cnt = 0;
    for (int i = 0; i < m; i++) {
        Vec xi = test_set[i];
        double yi = test_label[i];
        double exp_wx = exp(mul_vv(w, xi));
        double predict = exp_wx / (1 + exp_wx);
        double res = predict >= 0.5 ? 1 : 0;
        if (res != yi) err_cnt++;
    }
    double acc_rate = 1 - (err_cnt / m);
    return acc_rate;
}

posted @ 2021-03-16 19:15 tmpUser 阅读(459) 评论(0) 编辑收藏举报

刷新页面返回顶部

tmpUser

【机器学习】逻辑回归的C++实现

train

test

公告