摘要: 为什么在分类问题往往使用交叉熵作为损失函数? 假设数据标签为 \(Y\) = [[0, 1, 0], [0, 0, 1]],预测为 \(\hat{Y}\) = [[0.1, 0.6, 0.3], [0.5, 0.3, 0.2]] 此时模型在真实类别上给出的联合概率就是 p = 0.6 * 0.2,以 阅读全文
posted @ 2022-02-15 22:57 Bill_H 阅读(167) 评论(0) 推荐(0) 编辑