摘要:
一、解决的问题 采用传统编码器-解码器结构的LSTM/RNN模型存在一个问题,不论输入长短都将其编码成一个固定长度的向量表示,这使模型对于长输入序列的学习效果很差(解码效果很差)。 注意下图中,ax 和 axx 部分。 公式如下 科普: http://www.jeyzhang.com/underst 阅读全文
posted @ 2018-04-13 14:50 AYE89 阅读(1515) 评论(0) 推荐(0) 编辑
|
||
摘要:
一、解决的问题 采用传统编码器-解码器结构的LSTM/RNN模型存在一个问题,不论输入长短都将其编码成一个固定长度的向量表示,这使模型对于长输入序列的学习效果很差(解码效果很差)。 注意下图中,ax 和 axx 部分。 公式如下 科普: http://www.jeyzhang.com/underst 阅读全文
posted @ 2018-04-13 14:50 AYE89 阅读(1515) 评论(0) 推荐(0) 编辑 |
||