softmax回归

一、前言

1、softmax回归不是回归问题，而是分类问题

2、分类问题：对离散值的预测。

3、分类问题通常有多个输出，输出 i 预测为第 i 类的置信度

二、网络结构

1、为了估计所有可能类别的条件概率，我们需要一个有多个输出的模型，每个类别对应一个输出

2、在我们的例子中，由于我们有4个特征和3个可能的输出类别，我们将需要12个标量来表示权重（带下标的

6、上图中，输入层的每个x都表示样本的一个特征。输出层的三个o就是类别数

三、softmax运算

1、基本思想：在分类中，我们采取的主要方法就是将模型的输出视作为概率，我们希望模型的输出

softmax 运算不会改变未归一化的预测

$b \in R^{1 \times q}$

1、我们已经知道，softmax运算将输出变换为了一个合法的类别预测分布

2、实际上，真实标签也可以用类别分布表达：对于样本 i，我们构造向量y(i)∈Rq，使其第y(i)（样本i类别的离散数值）个元素为1，其余为0。

3、对于任何标签

$0$

posted @ 2021-07-27 09:18 小秦同学在上学阅读(280) 评论(0) 编辑收藏举报

刷新页面返回顶部