摘要:
2024-03-26 , 由中国科学院深圳先进技术研究院、北京大学、中国科学技术大学等联合发布数据集COIG-CQIA,这是一个高质量的中文指令微调数据集,包括问答和文章,以提供与人类互动一致的指令微调数据。 一、目前遇到困难和挑战 1、语言和文化差异: 中文具有独特的语言特征和文化深度,与英文存在 阅读全文
摘要:
IEPile:由浙江大学和蚂蚁集团等联合发布一个全面的双语信息抽取(IE)指令语料库 2024-04-11 ,由浙江大学;蚂蚁集团;浙江大学-蚂蚁集团知识图谱联合实验室联合发布IEPile,一个全面的双语(英语和中文)IE指令语料库,包含约3.2亿个标记。 现在目前遇到问题和挑战 1、大型语言模型( 阅读全文