Fork me on GitHub
摘要: 讲在前面,chatgpt出来的时候就想过将其利用在信息抽取方面,后续也发现了不少基于这种大语言模型的信息抽取的论文,比如之前收集过的: https://github.com/cocacola-lab/GPT4IEhttps://github.com/RidongHan/Evaluation-of-C 阅读全文
posted @ 2023-04-21 15:02 西西嘛呦 阅读(2433) 评论(0) 推荐(2) 编辑
摘要: 怎么裁剪LLM(大语言模型)的vocab(词表)? Part1前言 对于一些多语言的大语言模型而言,它的词表往往很大。在下游使用这些模型的时候,可能我们不需要其它的一些语言,例如只需要中文和英文,此时,我们可以对其vocab进行裁剪,既可以大大减少参数量,也能够保留模型的性能,接下来以Bloom模型 阅读全文
posted @ 2023-04-21 14:02 西西嘛呦 阅读(1093) 评论(0) 推荐(0) 编辑