摘要: https://blog.csdn.net/taoqick/article/details/102621605 原因一,使用交叉熵loss下降的更快; 原因二,使用交叉熵是凸优化,MSE是非凸优化 1. 损失函数角度 对一个多分类问题,我们一般用onehot编码来表示label,比如猫、老虎、狗的3 阅读全文
posted @ 2021-08-10 22:44 xd_xumaomao 阅读(1188) 评论(0) 推荐(0) 编辑