常见的损失函数与常用模型评价指标

一、损失函数

1、0~1损失

$$L(y_{i},f(x_{i}))=\begin{Bmatrix}
1 & y_{i}\neq f(x_{i})\\
0& y_{i}=f(x_{i})
\end{Bmatrix}$$

0~1损失简单易于理解，用于分类，如果预测的标签和数据标注的标签一致，那么就为0，否则就为1，当然，如果认为相等的要求太严苛，可以放宽要求，用实际值和预测值做差取绝对值。

$$L(y_{i},f(x_{i}))=\begin{Bmatrix}
1 & \mid y_{i}- f(x_{i})\mid \geqslant t\\
0& \mid y_{i}-f(x_{i})\mid < t
\end{Bmatrix}$$

2、平方损失函数

$$L(y_{i},f(x_{i}))=(y_{i}-f(x_{i}))^{2}$$

线性回归的损失函数

$$L(\omega,x)=\frac{1}{2N}\sum_{i=1}^{N}(y^{i}-\omega^{T}x^{i})^{2}+\frac{\lambda}{2}\left \| \omega \right \|^{2}$$

3、绝对损失函数

$$L(y_{i},f(x_{i}))=\left | y_{i}-f(x_{i}) \right |$$

4、对数损失函数（Log loss or cross-entropy loss）

$$L(y_{i},f(x_{i}))=-logP(y_{i}|x_{i})$$

5、Hinge Loss（铰链损失函数）

$$L(y_{i},f(x_{i}))=max(0,1-y_{i}f(x_{i}))$$

6、指数损失函数

$$L(y_{i},f(x_{i}))=exp(-y_{i}f(x_{i}))$$

二、分类评判指标

混淆矩阵		预测值
混淆矩阵		positive	negtive
真实值	positive	TP	FN
真实值	negtive	FP	TN

P 所有正样本
N 所有负样本

1、Accuracy

$$Accuracy=\frac{TP+TN}{P+N}$$

2、Precision

$$Precision=\frac{TP}{TP+FP}$$

3、Recall

$$Recall=\frac{TP}{P}$$

4、F1

$$F1=2*\frac{Precision*Recall}{Precision+Recall}$$

5、ROC

　　在信号检测中，ROC（receiver operating characteristic curve）是一种坐标图示的分析工具。用来挑选模型并且用来设定阈值的方法。ROC空间将FPR（伪阳率）设定为横轴，TPR（真阳率）设定为纵轴。

$$TPR=\frac{TP}{P}$$

$$FPR=\frac{FP}{N}$$

　　ROC曲线产生的过程：

将预测样本的概率值score由大到小排序
接着我们从高到低，依次将score作为threshold，将大于等于threshold的样本设为预测正样本，小于threshold的样本设定为预测负样本，然后分别计算在不同threshold下的TPR和FPR，绘制ROC曲线。

6、AUC

Roc下面积

参考：

维基百科ROC介绍

posted @ 2019-04-26 15:34 ylxn 阅读(933) 评论(0) 编辑收藏举报

刷新页面返回顶部

ylxn

时光旅客～