摘要:
基于注意机制的编码解码结构例如LAS(Listen,Attention,Spell),将声学模型,发音模型和语言模型统一在一起,使得语音识别做到了端到端训练. 本文在LAS基础上,在建模结构和优化过程这两个方面做出了一些改进,从而显著地提升模型性能.建 阅读全文
摘要:
Attention is all you need 3 模型结构 大多数牛掰的序列传导模型都具有encoder decoder结构. 此处的encoder模块将输入的符号序列$(x_1,x_2,...,x_n)$映射为连续的表示序列${\bf z} = 阅读全文