上一页 1 2 3 4 5 6 7 8 ··· 22 下一页
摘要: 我们在 4.7节中描述了多层感知机中的 前向与反向传播及相关的计算图。 循环神经网络中的前向传播相对简单。 通过时间反向传播(backpropagation through time,BPTT) (Werbos, 1990)实际上是循环神经网络中反向传播技术的一个特定应用。 它要求我们将循环神经网络 阅读全文
posted @ 2023-11-12 16:05 Yohoc 阅读(25) 评论(0) 推荐(0) 编辑
摘要: 独热编码 回想一下,在train_iter中,每个词元都表示为一个数字索引, 将这些索引直接输入神经网络可能会使学习变得困难。 我们通常将每个词元表示为更具表现力的特征向量。 最简单的表示称为独热编码(one-hot encoding), 它在 3.4.1节中介绍过。 简言之,将每个索引映射为相互不 阅读全文
posted @ 2023-11-12 14:03 Yohoc 阅读(45) 评论(0) 推荐(0) 编辑
摘要: 隐状态 无隐状态的神经网络 有隐状态的循环神经网络 循环神经网络(recurrent neural networks,RNNs) 是具有隐状态的神经网络。 (循环层、输出层) Xt为三维张量(时间步数num_steps,批量大小batch_size,词表大小vocab_size) Qt为三维张量(时 阅读全文
posted @ 2023-11-12 11:24 Yohoc 阅读(25) 评论(0) 推荐(0) 编辑
摘要: 语言模型 马尔可夫模型和n元语法 自然语言统计 读取长序列数据 由于序列数据本质上是连续的,因此我们在处理数据时需要解决这个问题。 在 8.1节中我们以一种相当特别的方式做到了这一点: 当序列变得太长而不能被模型一次性全部处理时, 我们可能希望拆分这样的序列方便模型读取。 在介绍该模型之前,我们看一 阅读全文
posted @ 2023-11-10 22:05 Yohoc 阅读(26) 评论(0) 推荐(0) 编辑
摘要: 对于序列数据处理问题,我们在 8.1节中 评估了所需的统计工具和预测时面临的挑战。 这样的数据存在许多种形式,文本是最常见例子之一。 例如,一篇文章可以被简单地看作一串单词序列,甚至是一串字符序列。 本节中,我们将解析文本的常见预处理步骤。 这些步骤通常包括: 将文本作为字符串加载到内存中。 将字符 阅读全文
posted @ 2023-11-10 20:45 Yohoc 阅读(32) 评论(0) 推荐(0) 编辑
摘要: 在本质上,音乐、语音、文本和视频都是连续的。 如果它们的序列被我们重排,那么就会失去原有的意义。 比如,一个文本标题“狗咬人”远没有“人咬狗”那么令人惊讶,尽管组成两句话的字完全相同。 处理序列数据需要统计工具和新的深度神经网络架构。 为了简单起见,我们以 图8.1.1所示的股票价格(富时100指数 阅读全文
posted @ 2023-11-10 19:06 Yohoc 阅读(42) 评论(0) 推荐(0) 编辑
摘要: 从ResNet到DesNet 稠密块体 DenseNet使用了ResNet改良版的“批量规范化、激活和卷积”架构(参见 7.6节中的练习)。 我们首先实现一下这个架构。 import torch from torch import nn from d2l import torch as d2l de 阅读全文
posted @ 2023-11-09 14:15 Yohoc 阅读(44) 评论(0) 推荐(0) 编辑
摘要: 函数类 残差块 import torch from torch import nn from torch.nn import functional as F from d2l import torch as d2l class Residual(nn.Module): #@save def __in 阅读全文
posted @ 2023-11-09 13:40 Yohoc 阅读(27) 评论(0) 推荐(0) 编辑
摘要: 训练深层神经网络是十分困难的,特别是在较短的时间内使他们收敛更加棘手。 本节将介绍批量规范化(batch normalization) (Ioffe and Szegedy, 2015),这是一种流行且有效的技术,可持续加速深层网络的收敛速度。 再结合在 7.6节中将介绍的残差块,批量规范化使得研究 阅读全文
posted @ 2023-11-09 12:07 Yohoc 阅读(40) 评论(0) 推荐(0) 编辑
摘要: Inception块 在GoogLeNet中,基本的卷积块被称为Inception块(Inception block)。具体结构如下图: 这四条路径都使用合适的填充来使输入与输出的高和宽一致,最后我们将每条线路的输出在通道维度上连结,并构成Inception块的输出。在Inception块中,通常调 阅读全文
posted @ 2023-11-09 10:51 Yohoc 阅读(18) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 22 下一页