吴恩达《LangChain for LLM Application Development》课程笔记

1. 前言

LangChain是一个用来构建LLM应用的开源框架，主要是为基于大语言模型的应用提供一系列的构建工具包。这个短课程的主要内容有：

模型、提示和解析器：调用LLM，提供提示并解析响应。
LLM的记忆：用于存储对话和管理有限上下文空间的记忆。
链式操作：创建操作序列。
文档问答：将LLM应用于您的专有数据和用例需求。
代理：探索将LLM作为推理代理的新兴发展趋势。

原课程地址：https://www.deeplearning.ai/short-courses/langchain-for-llm-application-development/

B站转载：https://www.bilibili.com/video/BV1zu4y1Z7mc?p=1&vd_source=c2a322357481107ab7f418b1ae9ce618

建议使用Cousera，限时免费，还可以免费使用它们提供的jupyter notebook进行操作。

2. 课程笔记

2.1. 模型、提示和解析器

https://www.bilibili.com/video/BV1zu4y1Z7mc?p=2&vd_source=c2a322357481107ab7f418b1ae9ce618

这节课的要点有两个：

a. 使用Langchain的模板功能，将需要改动的部分抽象成变量，在具体的情况下替换成需要的内，达到一次定义，多次使用的效果。

书中提到的一个例子是，使用模板，去转化表达的风格。这种方式比fstring要更灵活，特别是模板很长的时候。

b. 使用一个解析器，将LLM的输出解析成你需要的格式，如字典。

2.2. LLM记忆，上下文管理

这节课主要如何使用不同的内存类来管理与LLM的对话上下文。

ConversationBufferMemory：保存所有上下文。
ConversationBufferWindowMemory：以对话轮数为单位，设置最大轮数限制。
ConversationTokenBufferMemory：以token的个数为单位，设置最大个数限制。
ConversationSummaryBufferMemory：可以设置对话token最大个数，但使用llm来总结之前的对话内容。

2.3. 链式操作

链式操作有点像工作流，基本单元是Chain，通过与LLM和提示词结合，可以构建出各种结构的链式操作，对文本及数据执行一系列操作。

a. 基础链

LLMChain，结合提示词，组成一个基本的单位，对输入进行相应，输出结果，是构建复合链的基本单位。

b. 顺序链

将基础链按照顺序前后组合起来，上一个基础链的输出是下一个基础链的输入，又包括以下两种细类：

SimpleSequentialChain：单输入/输出。

SequentialChain：多输入/输出，通过输入/输出键进行指定。

c. 路由链

LLMRouterChain，根据输入的内容，将其路由到不同的链中。

2.4. 文档问答

给定文档，让LLM根据文档的内容回答问题。

由于LLM一般一次只能处理几千个词，因此基于文档的问答需要使用embedding和向量存储技术。

2.4.1. stuff 方法

a. embeddings

所谓embedding（词嵌入）就是将一段文本，转化成一个能够表征文本语义的向量，语义上相近的文本他们的向量也相似。

b. 向量存储

一般将文本分解成一个个块（chunks），然后将每个块转为embedding，最后将这些embedding存入向量数据库中，相当于建立了索引。

c. 查询过程

首先将查询文本转为embedding，然后在向量数据库中寻找并返回与这个查询最相似的n个查询。

d. LLM处理

最后将这n个结果输入LLM进行处理，获得最后的答案。

这就是文档问答最简单的办法，将所有文档都放入上下文中，并对语音模型进行一次调用，这种方法叫stuff method。

前面都是针对相同类型的片段进行回答的方法，但是针对不同类型的片段进行相同类型的问题和回答，则需要用到下面的几种方法。

2.4.2. 其他方法

Map_reduce方法：将每个片段和问题一起传递给LLM，得到各自的回答，然后使用另外一个LLM将所有单独的回答汇总成最后的答案。可以看到每个文档都是独立的，有利于并行执行，缺点是文档与文档之间也没有交互。

Refine方法：当前的回答依赖于上一个文档的回答，对于合并信息和逐步构建答案非常有用，最后的答案长度趋于更长，缺点是并行度差，需要更长的处理时间。

Map_rank方法：一种实验性的方法，为每个文档执行一次LLM调用，并返回回答与评分，选择分数最高的那个回答。这个方法，依赖于语言模型需要知道如何评分以及你关于评分的指导说明。这个方法并行度和MapReduce方法一样。

2.5. LLM应用评估

这节主要深入介绍一些框架，以及帮助进行评估的工具，亮点是使用LLM和链式操作来评估其他LLM、链式操作或者应用程序。

一种做法是，查看数据，提出示例问题，并提供正确答案以便评估，这个过程可以使用QAGenerateChain类来实现自动化。

另外，可以使用QAEvalChain类，来自动评估LLM对问题的回答是否是正确的，这个很重要，因为很多时候，可能正确答案跟回答的意思是一样的，但是表述却区别很大，无法单纯使用字符串匹配或者正则来比较。

为了调试中间过程，可以将langchain.debug = True，这样中间的提示，QA的检索过程，输入输出，token的使用情况等信息都可以打印出来。

另外本节还简单介绍了一下LangChain评估平台，可以将上述过程持久化并在用户界面中展示出来，另外还可以查看中间的调试信息，并且可以将生成的问答整理成新的数据集。

2.6. 代理

代理的目的，是将LLM视为一个推理引擎，你可以提供文本块或者其他信息源给它，然后这个LLM可以利用互联网上学到的背景知识，帮助回答问题和推理内容。

本节主要内容包括如何创建和使用代理，如何为其配备内在LangChain中的搜索引擎等不同类型的工具，让代理可以与任何数据存储，任何API和函数进行交互。

2.6.1. 预定义工具

llm-math：实际是个Chain，使用语言模型和计算器来解决数学问题。
wikipedia：维基百科工具，连接到维基百科的API，允许对维基百科进行搜索查询并返回结果。
PythonREPLTool：python执行环境，根据输入提示，使用python进行推理，并对推理结果进行相应处理，如打印出来。

初始化代理后，代理能够自动根据问题的类型，选择合适的工具进行推理，开了verbose标志后，可以看到代理每一步的推理过程。

2.6.2. 自定义工具

另外，还可以将代理连接到自己的信息源、API和数据，需要自定义自己的工具，操作步骤：

在自己的工具函数前加上LangChain库中的@tool装饰器，然后写一个非常详细的文档，用来让代理了解一些约束及如何调用该工具。

（完）

posted @ 2023-07-12 14:47 大师兄啊哈阅读(1281) 评论(0) 编辑收藏举报

刷新页面返回顶部

大师兄的博客

过早退出是一切失败的根源