摘要:
本文介绍了LSTM网络中的TimeDistributed包装层,代码演示了具有TimeDistributed层的LSTM网络配置方法。 演示了一对一,多对一,多对多,三种不同的预测方法如何配置。 在对多对一预测中用了不配置TimeDistributed的方法,在多对多预测中使用了TimeDistri 阅读全文
摘要:
From the offical code: So - basically the TimeDistributedDense was introduced first in early versions of Keras in order to apply a Dense layer stepwis 阅读全文
摘要:
2017年中,有两篇类似同时也是笔者非常欣赏的论文,分别是FaceBook的《Convolutional Sequence to Sequence Learning》和Google的《Attention is All You Need》,它们都算是Seq2Seq上的创新,本质上来说,都是抛弃了RNN结构来做Seq2Seq任务。这篇博文中,笔者对《Attention is All You Need》... 阅读全文