模型+数据=新模型
- 链家BELLE
https://mp.weixin.qq.com/s/73EI7cY10ERQ075v2Uvyqg,
中文对话大模型BELLE全面开源!
https://github.com/LianjiaTech/BELLE
该项目目前已经开源了如下内容,并且在持续更新中:
150万中文指令微调数据集
以Bloomz-7b1-mt(70亿参数)为基础,分别在20万,60万,100万,200万数据上进行指令微调后得到的模型Checkpoint。
以LLAMA-7b(70亿参数)为基础,分别在60万,200万数据上进行指令微调后得到的模型Checkpoint。
对以上模型进行量化后的轻量化模型,便于部署、推理。
- Firefly(流萤)
https://mp.weixin.qq.com/s/O1QV32QRJtYjtvu6ZCDc7Q,
Firefly(流萤): 中文对话式大语言模型
https://github.com/yangjianxin1/Firefly