2021年11月15日
摘要: CPT: A Pre-Trained Unbalanced Transformer for Both Chinese Language Understanding and Generation 复旦大学,邱锡鹏老师团队 使用不平衡的Transformer编码器解码器架构,用MLM和DAE联合预训练, 阅读全文
posted @ 2021-11-15 10:15 宋岳庭 阅读(899) 评论(0) 推荐(0) 编辑