机器学习损失函数汇总——2020.2.12

损失函数（loss function）是用来估量模型的预测值\(f(x)\)与真实值\(Y\)的不一致程度，从而衡量模型预测的好坏。它是一个非负实值函数,通常使用\(L(Y, f(x))\)来表示，损失函数越小，模型的鲁棒性就越好。

常见的损失误差主要有以下几种：

0-1损失函数是最为简单的一种损失函数，多适用于分类问题中，如果预测值与目标值不相等，说明预测错误，输出值为1；如果预测值与目标值相同，说明预测正确，输出为0，言外之意没有损失。其数学公式可表示为：

\[L(Y,f(X)) = \left\{ \begin{aligned} 1 & \text{, Y ≠ f(X)}\\ 0 & \text{, y = f(X)} \end{aligned} \right. \]

但是0-1损失函数过于理想化、严格化，数学性质不好，难以优化，因此在实际问题中，我们经常会用其他损失函数进行代替。

对数损失函数常用于逻辑回归问题中，其标准形式为：

\[L(Y,P(Y|X)) = -logP(Y|X) \]

Hinge损失函数通常适用于二分类的场景中，可以用来解决间隔最大化的问题，常应用于著名的SVM算法中。其数学公式为：

\[L(y) = max(0,1-y \cdot f(x)) \]

hinge损失函数表示如果被分类正确，损失为0，否则损失就为 [公式] 。SVM就是使用这个损失函数。
一般的 [公式] 是预测值，在-1到1之间， [公式] 是目标值(-1或1)。其含义是， [公式] 的值在-1和+1之间就可以了，并不鼓励 [公式] ，即并不鼓励分类器过度自信，让某个正确分类的样本距离分割线超过1并不会有任何奖励，从而使分类器可以更专注于整体的误差。
健壮性相对较高，对异常点、噪声不敏感，但它没太好的概率解释。

Cross-Entropy损失函数函数公式如下：

\[L(f,y) = -log_2(\frac{1+f_y}{2}) \]

Cross-Entropy损失函数是0-1损失函数的光滑凸上界

Softmax Loss函数公式如下：

\[L = - \sum^{ T}_{j=1}{y_i logs_j} \]

Cross-Entropy损失函数是0-1损失函数的光滑凸上界

平方损失函数是指预测值与真实值差值的平方。损失越大，说明预测值与真实值的差值越大。平方损失函数多用于线性回归任务中，其数学公式为：

\[L(Y,f(X)) = (Y-f(X))^2 \]

平方损失函数是光滑的，可以用梯度下降法求解，但是，当预测值和真实值差异较大时，它的惩罚力度较大，因此对异常点较为敏感。

指数损失函数的标准形式如下：

\[L(Y|f(X)) = exp[-yf(x)] \]

指数损失函数是AdaBoost里使用的损失函数，因为它对离群点、噪声非常敏感。Adaboost是前项分步加法算法的特例，因此经常用在AdaBoost算法中。

posted @ 2020-02-12 22:16 Someday&Li 阅读(561) 评论(0) 编辑收藏举报

刷新页面返回顶部