随笔- 2329 文章- 0 评论- 61 阅读- 194万

反向传播过程中不可导情况处理

参考这篇文章：

https://blog.csdn.net/weixin_42720875/article/details/105936398

《神经网络反向求导不可导情况处理》

写的蛮好，主要写了Relu函数、平均池化、最大池化的处理方式。

Relu函数

次梯度方法(subgradient method)是传统的梯度下降方法的拓展，用来处理不可导的凸函数。它的优势是比传统方法处理问题范围大，劣势是算法收敛速度慢。但是，由于它对不可导函数有很好的处理方法，所以学习它还是很有必要的。

对于relu函数，当x>0时，导数为1，当x<0时导数为0。因此relu函数在x=0的次梯度c ∈ [ 0 , 1 ] c\in[0,1]c∈[0,1]，c可以取[0,1]之间的任意值。

下面还有一张图是一些常见激活函数的导数结果，可以简单看看。

posted @ 2022-02-22 20:17 blcblc 阅读(500) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· PRelu和一些激活函数

· TensorFlow-深度学习入门指南-全-

历史上的今天：
2019-02-22 识别疑问句的训练
2019-02-22 准备参考这个做个tf-serving
2018-02-22 推荐-离线评估指标-设计 - F-Score, AUC，NDCG，MAP等等 - 目标不可微很难优化 - NDCG连续MAP离散 - 弱泛化和强泛化 - 冷启动 - 训练测试集拆分的好办法
2018-02-22 矩阵相乘与行列变换
2018-02-22 SVM和SVC的学习
2018-02-22 标准化- 正则化等数据处理 sklearn来支持
2018-02-22 从mofa上面学习sklearn - 通用流程，标准化，learning_curve，validation_curve