大模型评测-微软亚洲研究院:A Survey on Evaluation of Large Language Models论文分享
《A Survey on Evaluation of Large Language Models》
一、论文介绍:微软亚洲研究院公开了介绍大模型评测领域的论文《A Survey on Evaluation of Large Language Models》。该论文一共调研了219篇文献,以评测内容 (what to evaluate)、评测领域 (where to evaluate)、评测方法 (How to evaluate)和目前的评测挑战话题展开的研究。
二、评测过程
三、感谢的朋友可以留言,无条件分享论文!!!