09 2023 档案
摘要:# LoRA 简介 ## 简介 **LoRA,英文全称Low-Rank Adaptation of Large Language Models,直译为大语言模型的低阶适应,这是微软的研究人员为了解决大语言模型微调而开发的一项技术。** 如果想让一个预训练大语言模型能够执行特定领域内的任务,一般需要做
阅读全文
摘要:# Python 命令行工具库:Fire > Python Fire 是 Google 开源的一个可从任何 Python 代码自动生成命令行接口(CLI)的库。 Python Fire 是一种在 Python 中创建 CLI 的简单方法。 Python Fire 是开发和调试 Python 代码的有
阅读全文
摘要:# Ziya-LLaMA-13B 模型在GPU 上部署 Ziya-LLaMA-13B是IDEA-CCNL基于LLaMa的130亿参数的大规模预训练模型,具备翻译,编程,文本分类,信息抽取,摘要,文案生成,常识问答和数学计算等能力。目前姜子牙通用大模型已完成大规模预训练、多任务有监督微调和人类反馈学习
阅读全文