随笔档案「2023年9月」 - michaelchengjl

LoRA 简介

摘要：# LoRA 简介 ## 简介 **LoRA，英文全称Low-Rank Adaptation of Large Language Models，直译为大语言模型的低阶适应，这是微软的研究人员为了解决大语言模型微调而开发的一项技术。** 如果想让一个预训练大语言模型能够执行特定领域内的任务，一般需要做阅读全文

posted @ 2023-09-06 14:48 michaelchengjl 阅读(1496) 评论(0) 推荐(0)

Python 命令行工具库：Fire

摘要：# Python 命令行工具库：Fire > Python Fire 是 Google 开源的一个可从任何 Python 代码自动生成命令行接口（CLI）的库。 Python Fire 是一种在 Python 中创建 CLI 的简单方法。 Python Fire 是开发和调试 Python 代码的有阅读全文

posted @ 2023-09-05 09:21 michaelchengjl 阅读(234) 评论(0) 推荐(0)

Ziya-LLaMA-13B 模型在GPU 上部署

摘要：# Ziya-LLaMA-13B 模型在GPU 上部署 Ziya-LLaMA-13B是IDEA-CCNL基于LLaMa的130亿参数的大规模预训练模型，具备翻译，编程，文本分类，信息抽取，摘要，文案生成，常识问答和数学计算等能力。目前姜子牙通用大模型已完成大规模预训练、多任务有监督微调和人类反馈学习阅读全文

posted @ 2023-09-04 11:37 michaelchengjl 阅读(1158) 评论(1) 推荐(0)

michaelchengjl

09 2023 档案

公告