09 2023 档案

摘要:# LoRA 简介 ## 简介 **LoRA,英文全称Low-Rank Adaptation of Large Language Models,直译为大语言模型的低阶适应,这是微软的研究人员为了解决大语言模型微调而开发的一项技术。** 如果想让一个预训练大语言模型能够执行特定领域内的任务,一般需要做 阅读全文
posted @ 2023-09-06 14:48 michaelchengjl 阅读(923) 评论(0) 推荐(0) 编辑
摘要:# Python 命令行工具库:Fire > Python Fire 是 Google 开源的一个可从任何 Python 代码自动生成命令行接口(CLI)的库。 Python Fire 是一种在 Python 中创建 CLI 的简单方法。 Python Fire 是开发和调试 Python 代码的有 阅读全文
posted @ 2023-09-05 09:21 michaelchengjl 阅读(135) 评论(0) 推荐(0) 编辑
摘要:# Ziya-LLaMA-13B 模型在GPU 上部署 Ziya-LLaMA-13B是IDEA-CCNL基于LLaMa的130亿参数的大规模预训练模型,具备翻译,编程,文本分类,信息抽取,摘要,文案生成,常识问答和数学计算等能力。目前姜子牙通用大模型已完成大规模预训练、多任务有监督微调和人类反馈学习 阅读全文
posted @ 2023-09-04 11:37 michaelchengjl 阅读(992) 评论(1) 推荐(0) 编辑