扫地升 - 博客园

2023年10月5日

摘要： TRL（Transformer Reinforcement Learning）是一个使用强化学习来训练Transformer语言模型和Stable Diffusion模型的Python类库工具集，听上去很抽象，但如果说主要是做SFT（Supervised Fine-tuning）、RM（Reward 阅读全文

posted @ 2023-10-05 01:26 扫地升阅读(650) 评论(0) 推荐(0) 编辑

Llama2-Chinese项目：7-外延能力LangChain集成

摘要：本文介绍了Llama2模型集成LangChain框架的具体实现，这样可更方便地基于Llama2开发文档检索、问答机器人和智能体应用等。 1.调用Llama2类针对LangChain[1]框架封装的Llama2 LLM类见examples/llama2_for_langchain.py，调用代码如下阅读全文

posted @ 2023-10-05 01:25 扫地升阅读(193) 评论(0) 推荐(0) 编辑

Llama2-Chinese项目：6-模型评测

摘要：测试问题筛选自AtomBulb[1]，共95个测试问题，包含：通用知识、语言理解、创作能力、逻辑推理、代码编程、工作技能、使用工具、人格特征八个大的类别。 1.测试中的Prompt 例如对于问题"列出5种可以改善睡眠质量的方法"，如下所示： [INST] <<SYS>>You are a helpf 阅读全文

posted @ 2023-10-05 01:25 扫地升阅读(79) 评论(0) 推荐(0) 编辑

Llama2-Chinese项目：5-推理加速

摘要：随着大模型参数规模的不断增长，在有限的算力资源下，提升模型的推理速度逐渐变为一个重要的研究方向。常用的推理加速框架包含lmdeploy、FasterTransformer和vLLM等。一.lmdeploy推理部署 lmdeploy由上海人工智能实验室开发，推理使用C++/CUDA，对外提供pyth 阅读全文

posted @ 2023-10-05 01:24 扫地升阅读(1467) 评论(0) 推荐(0) 编辑

Llama2-Chinese项目：4-量化模型

摘要：一.量化模型调用方式下面是一个调用FlagAlpha/Llama2-Chinese-13b-Chat[1]的4bit压缩版本FlagAlpha/Llama2-Chinese-13b-Chat-4bit[2]的例子： from transformers import AutoTokenizerfro 阅读全文

posted @ 2023-10-05 01:24 扫地升阅读(1212) 评论(0) 推荐(0) 编辑

2023年10月1日

Llama2-Chinese项目：3.2-LoRA微调和模型量化

摘要：提供LoRA微调和全量参数微调代码，训练数据为data/train_sft.csv，验证数据为data/dev_sft.csv，数据格式为"<s>Human: "+问题+"\n</s><s>Assistant: "+答案。本文主要介绍Llama-2-7b模型LoRA微调以及4bit量化的实践过程。阅读全文

posted @ 2023-10-01 23:50 扫地升阅读(2120) 评论(0) 推荐(0) 编辑

Llama2-Chinese项目：3.1-全量参数微调

摘要：提供LoRA微调和全量参数微调代码，训练数据为data/train_sft.csv，验证数据为data/dev_sft.csv，数据格式如下所示： "<s>Human: "+问题+"\n</s><s>Assistant: "+答案举个例子，如下所示： <s>Human: 用一句话描述地球为什么是独阅读全文

posted @ 2023-10-01 00:06 扫地升阅读(1198) 评论(2) 推荐(1) 编辑

2023年9月29日

手动实现BERT

摘要：本文重点介绍了如何从零训练一个BERT模型的过程，包括整体上BERT模型架构、数据集如何做预处理、MASK替换策略、训练模型和保存、加载模型和测试等。一.BERT架构 BERT设计初衷是作为一个通用的backbone，然后在下游接入各种任务，包括翻译任务、分类任务、回归任务等。BERT模型架构如下阅读全文

posted @ 2023-09-29 23:23 扫地升阅读(129) 评论(0) 推荐(0) 编辑

手动实现Transformer

摘要： Transformer和BERT可谓是LLM的基础模型，彻底搞懂极其必要。Transformer最初设想是作为文本翻译模型使用的，而BERT模型构建使用了Transformer的部分组件，如果理解了Transformer，则能很轻松地理解BERT。一.Transformer模型架构 1.编码器（阅读全文

posted @ 2023-09-29 23:22 扫地升阅读(769) 评论(0) 推荐(4) 编辑

2023年9月26日

NebulaGraph实战：3-信息抽取构建知识图谱

摘要：自动信息抽取发展了几十年，虽然模型很多，但是泛化能力很难用满意来形容，直到LLM的诞生。虽然最终信息抽取质量部分还是需要专家审核，但是已经极大的提高了信息抽取的效率。因为传统方法需要大量时间来完成数据清洗、标注和训练，然后来实体抽取、实体属性抽取、实体关系抽取、事件抽取、实体链接和指代消解等等。现在阅读全文

posted @ 2023-09-26 00:12 扫地升阅读(790) 评论(0) 推荐(0) 编辑