RNN, LSTM
# 矩阵代表变换方式,相当于加减乘除。值就是值。 # :param varname: jsDoc风格的注释,用于说明参数的作用
LSTM笔记、个人理解:
设定:先遗忘→再输入门→输出门
C_t-1负责长时记忆,h_t-1负责短时记忆
遗忘门
[h_t-1,x_t]代表纵向堆叠:
输入门
长时记忆更新
输出门
输出:
隐藏层:
与RNN对比
本文假设都用:
sigmoid
tanh函数:隐藏层激活函数
# 矩阵代表变换方式,相当于加减乘除。值就是值。 # :param varname: jsDoc风格的注释,用于说明参数的作用
设定:先遗忘→再输入门→输出门
C_t-1负责长时记忆,h_t-1负责短时记忆
[h_t-1,x_t]代表纵向堆叠:
输出:
隐藏层:
本文假设都用:
sigmoid
tanh函数:隐藏层激活函数
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步