2021年9月10日
摘要: https://arxiv.org/pdf/2109.00301.pdf 本文特点:无限长期记忆、任意长度上下文 本文进行了3个实验: (1)综合实验,长度4000、8000、16000,预测token排序的准确率 (2)语言建模,在Wikitext-103 ,LTM取150 Gaussian RB 阅读全文
posted @ 2021-09-10 11:26 宋岳庭 阅读(175) 评论(0) 推荐(0) 编辑