摘要: 笔记摘抄 1. 问题描述 已知 [k, k+n)时刻的正弦函数,预测 [k+t, k+n+t)时刻的正弦曲线。 因为每个时刻曲线上的点是一个值,即feature_len=1 如果给出50个时刻的点,即seq_len=50 如果只提供一条曲线供输入,即batch=1 输入的shape=[seq_len 阅读全文
posted @ 2020-07-23 23:17 douzujun 阅读(1143) 评论(0) 推荐(0) 编辑
摘要: 笔记摘抄 1. 词嵌入 nn.Embedding(num_embeddings, embedding_dim, padding_idx=None, max_norm=None, norm_type=2.0, scale_grad_by_freq=False, sparse=False, _weigh 阅读全文
posted @ 2020-07-23 16:19 douzujun 阅读(1738) 评论(0) 推荐(1) 编辑
摘要: 1. nn.Linear() nn.Linear():用于设置网络中的全连接层,需要注意的是全连接层的输入与输出都是二维张量 一般形状为[batch_size, size],不同于卷积层要求输入输出是四维张量。其用法与形参说明如下: in_features指的是输入的二维张量的大小,即输入的[bat 阅读全文
posted @ 2020-07-23 16:15 douzujun 阅读(54795) 评论(0) 推荐(6) 编辑
摘要: https://blog.csdn.net/Answer3664/article/details/99460175 requires_grad=True 要求计算梯度 requires_grad=False 不要求计算梯度 with torch.no_grad()或者@torch.no_grad() 阅读全文
posted @ 2020-07-23 02:19 douzujun 阅读(7200) 评论(0) 推荐(1) 编辑