五.困惑

       1.根据损失函数求梯度,应该是所有误分类点的梯度之和,但实际上这样去做效果很差

       2.损失函数根本是不连续的(随着w,b的连续改变,误分类点改变,误差函数必然有着大量间断点),又怎么能求梯度呢

       3.最后是找到一个误分类点更新一次,感觉网上的博客没有说明这个问题

五.困惑

       1.根据损失函数求梯度,应该是所有误分类点的梯度之和,但实际上这样去做效果很差

       2.损失函数根本是不连续的(随着w,b的连续改变,误分类点改变,误差函数必然有着大量间断点),又怎么能求梯度呢

       3.最后是找到一个误分类点更新一次,感觉网上的博客没有说明这个问题

 

posted on 2020-05-28 19:41  日出看猪  阅读(65)  评论(0编辑  收藏  举报