摘要: 目录 代码结构 调用模型前的设置模块(hparams.py,prepro.py,data_load.py,utils.py) transformer代码解析(modules.py , model.py ) 训练和测试(train.py,eval.py和test.py ) 一、代码结构 论文主题模块 阅读全文
posted @ 2020-07-18 19:29 忆凡人生 阅读(2296) 评论(0) 推荐(0) 编辑
摘要: 目录 研究背景 论文思路 实现方式细节 实验结果 附件 专业术语列表 一、研究背景 1.1 涉及领域,前人工作等 本文主要处理语言模型任务,将Attention机制性能发挥出来,对比RNN,LSTM,GRU,Gated Recurrent Neural Networks 在序列建模和转换任务上的应用 阅读全文
posted @ 2020-07-18 19:21 忆凡人生 阅读(1586) 评论(0) 推荐(1) 编辑