书生·共学大模型实战营第4期 L1G6000 OpenCompass评测作业
基础任务:使用OpenCompass评测浦语API记录复现过程并截图
按照教程流程进行,这里我们采用的测试样本数为2,所以不同于教程,Acc可能为0,25%,50%,75%,100%,介绍两个遇到的bug:
-
metadata模块导入错误:ModuleNotFoundError: No module named 'importlib.metadata'
解决方法:将from importlib_metadata import distribution,metadata,version
改为from importlib.metadata import distribution,metadata,version
即可 -
rouge包导入错误:No module named 'rouge'
解决方法:先用pip uninstall rouge
删除rouge包,再用pip install rouge
重新安装即可
评测效果: