摘要: 注意力机制近几年比较热,在图像识别、图像翻译、语音识别、文本摘要、机器翻译等各个领域都有应用,特别是 NLP领域效果很好,本文旨在阐述其基本原理。 研究背景 当前神经网络的问题 算力问题:计算量太大,硬件无法支持,或者计算速度较慢 长序列问题:在处理序列问题时,当前的预测目标如果跟前一刻的状态很相关 阅读全文