摘要: 一、背景介绍 BERT和RoBERTa在文本语义相似度等句子对的回归任务上,已经达到了SOTA的结果。但是,它们都需要把两个句子同时喂到网络中,这样会导致巨大的计算开销:从10000个句子中找出最相似的句子对,大概需要5000万(C100002=49,995,000)个推理计算,在V100GPU上耗 阅读全文
posted @ 2020-05-12 10:01 光彩照人 阅读(14171) 评论(1) 推荐(1) 编辑