RNN-1-参数共享、网络的展开、常见应用

RNN简介

  循环神经网络的主要用途是处理和预测序列数据。

RNN的网络结构

1、循环神经网络的经典结构


  从网络结构上,循环神经网络会记忆之前的信息,并利用之前的信息影响后面节点的输出。
  参数共享思想:由于模块A中的运算和变量在不同时刻是相同的,因此循环神经网络理论上可以看作是同一神经网络被无限复制的结果。循环神经网络在不同的位置共享参数,从而使有限的参数处理任意长度的序列。

2、循环神经网络按时间展开后的结构


  将循环神经网络对长度为N的序列展开后,可视为一个有着N个中间层的前馈神经网络。对于一个序列数据,可以将这个序列上不同时刻的数据依次传入循环神经网络的输入层,输出时可以是对下一个时刻的预测,也可以是对当前时刻信息处理的结果。循环神经网络要求每一个时刻都有一个输入,但不一定每个时刻都需要有输出。

3、循环神经网络实现机器翻译示意图


  机器翻译的网络结构可以分为两部分:encoder和decoder。简单描述一下机器翻译的过程,假设机器翻译的的句子是ABCD,那么循环神经网络的第一个时刻的输入分别是A、B、C、D,然后用第一个 _ 作为开始翻译的提示符。在翻译的过程中每一个时刻的输入都是上一个时刻的输出,当预测输出为 _ 时翻译结束,得到的XYZ就是ABCD的翻译结果。

posted @   紫藤花下酒馆  阅读(1106)  评论(0编辑  收藏  举报
编辑推荐:
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 三行代码完成国际化适配,妙~啊~
· .NET Core 中如何实现缓存的预热?
点击右上角即可分享
微信分享提示