摘要:
目录 代码结构 调用模型前的设置模块(hparams.py,prepro.py,data_load.py,utils.py) transformer代码解析(modules.py , model.py ) 训练和测试(train.py,eval.py和test.py ) 一、代码结构 论文主题模块 阅读全文
摘要:
目录 研究背景 论文思路 实现方式细节 实验结果 附件 专业术语列表 一、研究背景 1.1 涉及领域,前人工作等 本文主要处理语言模型任务,将Attention机制性能发挥出来,对比RNN,LSTM,GRU,Gated Recurrent Neural Networks 在序列建模和转换任务上的应用 阅读全文