Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation

1.主要完成的任务是能够将英文转译为法文,使用了一个encoder-decoder模型,在encoder的RNN模型中是将序列转化为一个向量。在decoder中是将向量转化为输出序列,使用encoder-decoder能够加入词语与词语之间的顺序信息。

2.另一个任务是将序列表达为一个向量,利用向量能够清楚的看出那些语义上相近的词聚集在一起。

3.在设计RNN的隐藏层时,在读入或产生序列加入了reset和update门,可以选择丢掉记忆信息和更新记忆信息,得到了更有意义的结果。

4.两个RNN网络共同训练最大化输入序列到输出序列的条件概率。另一方面提出相当复杂的隐含层,来提高内存容量和训练的简单性。

5.取得比较好的效果的原因是:1.能够抓住语言规律,并且语言表达保留了语义和句法结构。

6.训练好的模型可用来给定输入序列得到输出序列,对输入序列和输出序列打分。

posted @ 2016-10-16 17:59  wangzbob  阅读(1944)  评论(0编辑  收藏  举报