五.困惑
1.根据损失函数求梯度,应该是所有误分类点的梯度之和,但实际上这样去做效果很差
2.损失函数根本是不连续的(随着w,b的连续改变,误分类点改变,误差函数必然有着大量间断点),又怎么能求梯度呢
3.最后是找到一个误分类点更新一次,感觉网上的博客没有说明这个问题
五.困惑
1.根据损失函数求梯度,应该是所有误分类点的梯度之和,但实际上这样去做效果很差
2.损失函数根本是不连续的(随着w,b的连续改变,误分类点改变,误差函数必然有着大量间断点),又怎么能求梯度呢
3.最后是找到一个误分类点更新一次,感觉网上的博客没有说明这个问题