Label Smoothing(标签平移)

作用

标签平滑（Label smoothing），像L1、L2和dropout一样，是机器学习领域的一种正则化方法，通常用于分类问题，目的是防止模型在训练时过于自信地预测标签，改善泛化能力差的问题。

原理分析

以上便为从onehot编码到标签偏移的公式。可以清楚的看到做完这种变化之后把原来onehot为0的地方变大了，为1的地方变小了，这样就导致在算交叉熵的时候不会只考虑相应类别的那个预测对应的损失，此时会把对所有类别的预测都会考虑进来算损失，使得对所有类别的预测都会相应的变大，只不过经过smoothing之后真实类别的那部分权重更大，模型会更加侧重于对应真实类别的那个预测。
避免模型对于正确标签过于自信，使得预测正负样本的输出值差别不那么大，从而避免过拟合，提高模型的泛化能力
超参数一般设置为0.1

代码实现（pytorch）

 def label_smooth(label, n_class=3,alpha=0.1):
    """
    标签平滑
    :param label: 真实lable
    :param n_class: 类别数目
    :param alpha: 平滑系数
    :return:
    """
    k = alpha / (n_class - 1)
    # temp [batch_size,n_class]
    temp = torch.full((label.shape[0], n_class), k)
    # scatter_.(int dim, Tensor index, Tensor src),这个函数比较难理解——用src张量根据dim和index来修改temp中的元素
    temp = temp.scatter_(1, label.unsqueeze(1), (1-alpha))
    return temp

posted @ 2022-09-21 17:03 SXQ-BLOG 阅读(180) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 目标检测-SSD算法从零实现

· openmmlab 数据预处理讲解

· 标签平滑-Label Smoothing

· label smoothing

· Label Smoothing

阅读排行：
· 震惊！C++程序真的从main开始吗？99%的程序员都答错了
· winform 绘制太阳，地球，月球运作规律
· 【硬核科普】Trae如何「偷看」你的代码？零基础破解AI编程运行原理
· 上周热点回顾（3.3-3.9）
· 超详细：普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人

公告

昵称： SXQ-BLOG
园龄： 5年6个月
粉丝： 9
关注： 2

+加关注

2025年3月

日

一

二

三

四

五

六

青春无悔，我在路上

Label Smoothing(标签平移)

作用

原理分析

代码实现（pytorch）

公告

搜索

常用链接

最新随笔

积分与排名

随笔分类 (132)

随笔档案 (132)

阅读排行榜

推荐排行榜

最新评论

	def label_smooth(label, n_class=3,alpha=0.1):
	"""
	标签平滑
	:param label: 真实lable
	:param n_class: 类别数目
	:param alpha: 平滑系数
	:return:
	"""
	k = alpha / (n_class - 1)
	# temp [batch_size,n_class]
	temp = torch.full((label.shape[0], n_class), k)
	# scatter_.(int dim, Tensor index, Tensor src),这个函数比较难理解——用src张量根据dim和index来修改temp中的元素
	temp = temp.scatter_(1, label.unsqueeze(1), (1-alpha))
	return temp