摘要: 梯度消失问题和梯度爆炸问题,总的来说可以称为梯度不稳定问题。 【要背住的知识】:用ReLU代替Sigmoid,用BN层,用残差结构解决梯度消失问题。梯度爆炸问题的话,可以用正则化来限制。sigmoid的导数是【0,0.25】. 出现原因 两者出现原因都是因为链式法则。当模型的层数过多的时候,计算梯度 阅读全文
posted @ 2020-06-21 18:51 忽逢桃林 阅读(10541) 评论(0) 推荐(0) 编辑
摘要: boosting Boosting 算法的特点在于:将表现一般的弱分类器通过组合变成更好的模型。代表自然就是我们的随即森林了。 GBDT和Adaboost是boost算法中比较常见的两种,这里主要讲解Adaboost。 Adaboost Adaboost算法的核心就是两个权重。对于数据有一个权重,权 阅读全文
posted @ 2020-06-21 06:44 忽逢桃林 阅读(680) 评论(0) 推荐(0) 编辑