DecryptPrompt- - 风雨中的小七

解密Prompt系列8. 无需训练让LLM支持超长输入:知识库 & unlimiformer & PCW & NBCE

摘要：

这一章我们聊聊有哪些方案可以不用微调直接让大模型支持超长文本输入，分别介绍显式搜索，unlimiformer隐式搜索，并行输入的PCW，和并行解码的NBCE方案阅读全文

posted @ 2023-06-13 07:39 风雨中的小七阅读(3048) 评论(0) 推荐(0) 编辑

解密Prompt系列6. lora指令微调扣细节-请冷静,1个小时真不够~

摘要：

上一章介绍了如何基于APE+SELF自动化构建指令微调样本。这一章咱就把微调跑起来，主要介绍以Lora为首的低参数微调原理，环境配置，微调代码，以及大模型训练中显存和耗时优化的相关技术细节阅读全文

posted @ 2023-04-29 14:42 风雨中的小七阅读(4115) 评论(0) 推荐(2) 编辑

解密Prompt7. 偏好对齐RLHF-OpenAI·DeepMind·Anthropic对比分析

摘要：

RLHF是针对有用，无害，事实性等原则，把模型输出和人类偏好进行对齐的一种方案。以OpenAI为基础，本章会对比DeepMind, Anthropic在RLHF步骤中的异同，试图理解RLHF究竟做了啥阅读全文

posted @ 2023-05-23 07:35 风雨中的小七阅读(1085) 评论(0) 推荐(2) 编辑

解密prompt系列5. APE+SELF=自动化指令集构建代码实现

摘要：

把AutomaticPromptEngineer指令逆向工程，SELFInstruct指令扩充组个CP，完全依LLM来构建指令微调样本集！在医疗领域经初步尝试了下，附代码和可视化应用阅读全文

posted @ 2023-04-10 11:00 风雨中的小七阅读(1596) 评论(0) 推荐(1) 编辑

解密Prompt系列4. 升级Instruction Tuning：Flan/T0/InstructGPT/TKInstruct

摘要：

这一章我们聊聊指令微调，模型还是那个熟悉的模型，核心的差异在于指令集和评估侧重点的不同，每个模型只侧重介绍差异点。按时间顺序分别是Flan，T0，InstructGPT， Tk-Instruct 阅读全文

posted @ 2023-03-26 19:35 风雨中的小七阅读(2384) 评论(2) 推荐(1) 编辑

解密Prompt系列3. 冻结LM微调Prompt: Prefix-Tuning & Prompt-Tuning & P-Tuning

摘要：

这一章我们介绍在下游任务微调中固定LM参数，只微调Prompt的相关模型。这类模型的优势很直观就是微调的参数量小，能大幅降低LLM的微调参数量，是轻量级的微调替代品阅读全文

posted @ 2023-03-10 08:40 风雨中的小七阅读(4646) 评论(0) 推荐(0) 编辑

解密Prompt系列2. 冻结Prompt微调LM： T5 & PET & LM-BFF

摘要：

这一章我们介绍固定prompt微调LM的相关模型，他们的特点都是针对不同的下游任务设计不同的prompt模板，在微调过程中固定模板对预训练模型进行微调。以下按时间顺序介绍，支持任意NLP任务的T5，针对文本分类的两篇PET和LM-BFF。阅读全文

posted @ 2023-02-24 08:32 风雨中的小七阅读(1975) 评论(0) 推荐(2) 编辑

解密Prompt系列1. Tunning-Free Prompt：GPT2 & GPT3 & LAMA & AutoPrompt

摘要：

借着ChatGPT的东风，我们来梳理下prompt范式的相关模型，你还以其他形式看到过prompt概念，例如Demonstration，Instruction，In-Context learning，few-shot learning等等~开篇我们简单介绍下Prompt范式，并以其中的冻结参数Tunning-Free Prompt为线索串联GPT2，GPT3，LAMA和AutoPrompt这四种冻结参数的基础模型阅读全文

posted @ 2023-02-10 08:53 风雨中的小七阅读(3291) 评论(2) 推荐(0) 编辑

解密Prompt系列9. 模型复杂推理-思维链COT基础和进阶玩法

摘要：

这一篇真的是解密prompt！我们会讨论下思维链(chain-of-Thought)提示词究竟要如何写，如何写的更高级，介绍包括few-shot，zero-shot，循序渐进式和一致性COT的写法阅读全文

posted @ 2023-06-16 07:37 风雨中的小七阅读(4295) 评论(3) 推荐(1) 编辑

解密Prompt系列14. LLM Agent之搜索应用设计：WebGPT & WebGLM & WebCPM

摘要：

本章介绍如何和搜索引擎进行交互的LLM Agent设计，主要包含以下几个模块：搜索改写，事实抽取，聚合推理，行为交互。我们会以WebCPM为基础，同时介绍WebGPT，WebGLM的异同阅读全文

posted @ 2023-09-01 20:30 风雨中的小七阅读(1086) 评论(0) 推荐(0) 编辑

解密Prompt系列10. 思维链COT原理探究

摘要：

这一章我们追本溯源，讨论下COT的哪些元素是提升模型表现的核心。结合两篇论文的实验结论，可能导致思维链比常规推理拥有更高准确率的因素有:思维链的推理过程会重复问题中的核心实体；正确逻辑推理顺序的引入阅读全文

posted @ 2023-07-01 10:38 风雨中的小七阅读(1377) 评论(0) 推荐(0) 编辑

解密Prompt系列11. 小模型也能COT-先天不足后天来补

摘要：

现实场景中考虑成本和推理延时，大家还是希望能用6B的模型就不用100B的大模型。但在前两章反复提到小模型不具备思维链推理能力，那这个能力有可能通过后天训练来获得么？如何让小模型具备COT能力呢？阅读全文

posted @ 2023-07-15 08:33 风雨中的小七阅读(1129) 评论(0) 推荐(0) 编辑

解密Prompt系列12. LLM Agent零微调范式 ReAct & Self Ask

摘要：

这一章我们正式进入大模型应用，聊聊如何把思维链和工具使用结合得到人工智能代理。先介绍基于Prompt的零微调方案Self Ask和React，我们会结合langchain写个简单的Agent来玩一玩阅读全文

posted @ 2023-07-28 20:06 风雨中的小七阅读(2668) 评论(2) 推荐(0) 编辑

解密Prompt系列13. LLM Agent-指令微调方案: Toolformer & Gorilla

摘要：

本章介绍基于模型微调，支持任意多工具组合调用，复杂工具调用的方案。工具调用的核心是3个问题：在哪个位置使用工具，使用什么工具，如何生成调用语句 - Gorilla & Toolformer 阅读全文

posted @ 2023-08-17 09:20 风雨中的小七阅读(1639) 评论(7) 推荐(2) 编辑

解密Prompt系列15. LLM Agent之数据库应用设计：DIN & C3 & SQL-Palm & BIRD

摘要：

这一章我们来唠唠大模型和DB数据库之间的交互方案，除了基于Spider数据集的SOTA方案DIN之外，还会介绍两个改良方案C3和SQL-Palm，以及更贴合实际应用的大规模复杂SQL数据集BIRD。阅读全文

posted @ 2023-09-16 09:01 风雨中的小七阅读(1367) 评论(0) 推荐(2) 编辑

解密Prompt系列16. LLM对齐经验之数据越少越好？LTD & LIMA & AlpaGasus

摘要：

总结下指令微调、对齐样本筛选相关的方案包括LIMA，LTD等。论文都是以优化指令样本为核心，提出对齐阶段的数据质量优于数量，少量+多样+高质量的对齐数据，就能让你快速拥有效果杠杠的模型阅读全文

posted @ 2023-10-05 08:56 风雨中的小七阅读(700) 评论(0) 推荐(2) 编辑

解密Prompt系列17. LLM对齐方案再升级 WizardLM & BackTranslation & SELF-ALIGN

摘要：

这一章介绍通过扩写，改写，以及回译等半监督样本挖掘方案对种子样本进行扩充，提高种子指令样本的多样性和复杂度，这里我们分别介绍Microsoft，Meta和IBM提出的三个方案。阅读全文

posted @ 2023-10-14 09:26 风雨中的小七阅读(786) 评论(0) 推荐(2) 编辑

解密Prompt系列18. LLM Agent之只有智能体的世界

摘要：

前四章不论是和数据库和模型还是和搜索引擎交互，更多还是大模型和人之间的交互。这一章我们来唠唠只有大模型智能体的世界！分别基于源码介绍斯坦福小镇和Chatdev两篇论文阅读全文

posted @ 2023-10-28 08:24 风雨中的小七阅读(936) 评论(0) 推荐(1) 编辑

解密Prompt系列19. LLM Agent之数据分析领域的应用：Data-Copilot & InsightPilot

摘要：

这一章我们聊聊大模型在数据分析领域的应用。数据分析主要是指在获取数据之后的数据清洗，数据处理，建模，数据洞察和可视化的步骤。这里我们聊两篇论文：Data-Copilot 和 InsightPilot 阅读全文

posted @ 2023-11-19 08:10 风雨中的小七阅读(2122) 评论(0) 推荐(1) 编辑

解密Prompt系列20. LLM Agent之再谈RAG的召回多样性优化

摘要：

看完openai闭门会议对RAG又有些新的思考。这一章我们参考主流的搜索框架，结合新老论文，和langchain新功能聊聊RAG框架中召回多样性的优化方案，包括如何提高query多样性和索引多样性阅读全文

posted @ 2023-12-03 21:26 风雨中的小七阅读(2535) 评论(0) 推荐(0) 编辑

风雨中的小七

合集-DecryptPrompt

我的标签

合集 (7)

随笔档案 (114)

阅读排行榜

评论排行榜

推荐排行榜

最新评论