torch.nn.Embedding使用

在RNN模型的训练过程中，需要用到词嵌入，而torch.nn.Embedding就提供了这样的功能。我们只需要初始化torch.nn.Embedding(n,m)，n是单词数，m就是词向量的维度。

一开始embedding是随机的，在训练的时候会自动更新。

举个简单的例子：

word1和word2是两个长度为3的句子，保存的是单词所对应的词向量的索引号。

随机生成(4，5)维度大小的embedding，可以通过embedding.weight查看embedding的内容。

输入word1时，embedding会输出第0、1、2行词向量的内容，word2同理。

import torch
 
word1 = torch.LongTensor([0, 1, 2])
word2 = torch.LongTensor([3, 1, 2])
embedding = torch.nn.Embedding(4, 5)
 
print(embedding.weight)
print('word1:')
print(embedding(word1))
print('word2:')
print(embedding(word2))

除此之外，我们也可以导入已经训练好的词向量，但是需要设置训练过程中不更新。

如下所示，emb是已经训练得到的词向量，先初始化等同大小的embedding，然后将emb的数据复制过来，最后一定要设置weight.requires_grad为False。

self.embedding = torch.nn.Embedding(emb.size(0), emb.size(1))
self.embedding.weight = torch.nn.Parameter(emb)
 
# 固定embedding
self.embedding.weight.requires_grad = False

如果您觉得阅读本文对您有帮助，请点一下“推荐”按钮，您的“推荐”将是我最大的写作动力！欢迎各位转载，但是未经作者本人同意，转载文章之后必须在文章页面明显位置给出作者和原文连接，否则保留追究法律责任的权利。

posted @ 2020-10-09 15:15 Kayden_Cheung 阅读(1771) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

公告

昵称： Kayden_Cheung
园龄： 8年3个月
粉丝： 80
关注： 2

+加关注

2025年2月

日

一

二

三

四

五

六

Kayden_Cheung's Blog

对未来的真正慷慨，是把一切献给现在。

torch.nn.Embedding使用

公告

搜索

常用链接

积分与排名

随笔分类

阅读排行榜

评论排行榜

推荐排行榜

最新评论