【机器学习与深度学习理论要点】20. 什么是激活函数,为什么要用激活函数,常见的激活函数和特点,softmax函数

1)什么是激活函数,为什么要用激活函数?

激活函数,指神经网络中将输入信号的总和转换为输出信号的函数,激活函数将多层感知机输出转换为非线性,使得神经网络可以任意逼近任何非线性函数,这样神经网络就可以应用到众多的非线性模型中。

2)神经网络中常用的激活函数有哪些,各自有什么特点?

(1)sigmoid

①定义:sigmoid函数用于影藏层神经元输出,能将数值映射到(0,1)区间,可用来做二分类,表达式为:
f ( x ) = 1 1 + e − x f(x) = \frac{1}{1+e^{-x}} f(x)=1+ex1
②特点:

  • 优点:平滑、易于求导
  • 缺点:激活函数计算量大,反向传播时,很容易出现梯度消

(2)tanh

①定义:双曲正切函数,表达式为:
f ( x ) = 1 − e − 2 x 1 + e − 2 x f(x) = \frac{1-e^{-2x}}{1+e^{-2x}} f(x)=1+e2x1e2x
②特点:

  • 优点:平滑,易于求导,输出均值为0,收敛速度比sigmoid快,减少迭代次数
  • 缺点:很容易出现梯度消失

(3)relu

①定义:修正线性单元,其表达式为:
f ( x ) = { x ( x > 0 ) 0 ( x < = 0 ) f(x) = {x(x>0)0(x<=0) f(x)={x0(x>0)(x<=0)
②特点:

  • 优点:计算过程简单,避免了梯度消失和梯度爆炸问题
  • 缺点:小于等于0时无输出

3)什么是softmax函数,主要作用是什么

  • 定义:softmax函数可以将多分类的输出值转化为相对概率,而这些值的累加和为1,表达式为

S i = e V i ∑ i C e V i S_i = \frac{e^{V_i}}{\sum_i^Ce^{V_i}} Si=iCeVieVi

其中 V i V_i Vi 是分类器前级输出单元的输出。i 表示类别索引,总的类别个 数为 C。 S i S_i Si表示的是当前元素的指数与所有元素指数和的比值。

  • 作用:softmax一般用于分类输出层,计算属于每个类别的概率

作者:野哥李
微信公众号:AI算法学习社
欢迎任何形式的转载,但请务必注明出处。
限于本人水平,如果文章和代码有表述不当之处,还请不吝赐教。
本文章不做任何商业用途,仅作为自学所用,文章后面会有参考链接,我可能会复制原作者的话,如果介意,我会修改或者删除。

posted @   野哥李  阅读(42)  评论(0编辑  收藏  举报  
编辑推荐:
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
点击右上角即可分享
微信分享提示