2024年4月18日
摘要: 一、引言 可解释性代表的是一种以人类能够理解的方式解释模型行为的能力。 拥有可解释性有两个好处:①可解释性可以以人类能够理解的方式来很好的解释模型预测背后的原理,使普通人可以理解LLM的能力、缺陷。②对于研究者来说,可解释性可以帮助识别出偏见、风险和一些性能改进的领域。 二、LLM的训练 下游微调范 阅读全文
posted @ 2024-04-18 16:59 小黑哈哈 阅读(76) 评论(0) 推荐(0) 编辑