LangChain补充一：一些小且有用的点

一：LangChain 表达式语言LCEL（LangChain Expression Language）

chain：我们可以将包括大模型调用在内的一组操作组成“链条”，即所谓“调用链”

（一）概念

LangChain 提供的 LangChain Expression Language(LCEL) 让开发可以很方便地将多个组件连接成 AI 工作流（或者说是调用链）。如下是一个简单的工作流：

chain = prompt | chatmodel | outputparser
chain.invoke({"input":"What's your name?")

View Code

其中，通过由|管道操作符连接而成的 LangChain 表达式，我们方便地将三个组件 prompt chatmodel outparser 按顺序连接起来，这就形成了一个 AI 工作流。 invoke()则是实际运行这个工作流。

我们还可以组织较为复杂的 AI 工作流，如下所示，其中进行两次模型调用，并且示例中用的两个不同的模型。

chain = (
        prompt | chatmodel | outputparser |
        second_prompt | model2 | finalparser
        )
chain.invoke("input":"waht's AI?")

View Code

（二）：通过LCEL实现多次调用模型

多次调用模型，分步来进行操作，从而利用模型的能力得到更符合期待的结果。

from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough
from IPython.display import Markdown

llm = ChatOpenAI(
    model_name="gpt-4-1106-preview"    #创建聊天模型示例。这里采用 gpt-4-1106-preview 模型
)

prompt = ChatPromptTemplate.from_messages([
    ("system", "You are world class technical documentation writer."),
    ("user", "{input}")
])    #创建第一次模型调用的提示语模板。其中系统提示语是“You are world class technical documentation writer.”（你是一个世界级的技术文档编写者。）

translate_prompt = ChatPromptTemplate.from_messages([
    ("system", "Translate to simplified Chinese."),
    ("user", "{input}")
])    #创建第二次模型调用的提示语模板。其中系统提示语是“Translate to simplified Chinese.”（翻译为简体中文。）

output_parser = StrOutputParser()    #StrOutputParser，它可将输出解析为易读的文本格式，将 AIMessage 转换成 string

chain = prompt | llm | output_parser \
        | {"input": RunnablePassthrough()} \
        | translate_prompt | llm | output_parser    #建立调用链。其中用 RunnablePassthrough() 将第一次模型的输出作为第二次的输入。

output = chain.invoke({"input": "what's generative ai?"})

View Code

注意：其中用 RunnablePassthrough() 将第一次模型的输出作为第二次的输入

二：结合LCEL实现对输出的处理

之前是第五期 LangChain学习调用模型获取返回结果之后，调用解析器进行解析，这里是通过LCEL链接输出处理步骤。链接调用链时，解析部分parser会注入指令到prompt中去

首先，我们用 Pydnatic 定义一个对象：

# 用 Pydantic 定义输出的 JSON 格式
from langchain_core.pydantic_v1 import BaseModel, Field

# Define your desired data structure.
class Joke(BaseModel):
    setup: str = Field(description="question to set up a joke")
    punchline: str = Field(description="answer to resolve the joke")

View Code

然后，我们调用模型，并指示模型输出 JSON 格式：

from langchain_core.output_parsers import JsonOutputParser
from langchain.prompts import ChatPromptTemplate

chatmodel = ChatOpenAI()

joke_query = "Tell me a joke."

# Set up a parser + inject instructions into the prompt template.
parser = JsonOutputParser(pydantic_object=Joke)

prompt_template = ChatPromptTemplate.from_messages(
    [
      ("system", "Answer the user query.\n{format_instructions}"),
      ("user", "{query}")
    ])

chain = prompt_template | chatmodel | parser

#print(parser.get_format_instructions())

chain.invoke(
    {"query": joke_query,
     "format_instructions": parser.get_format_instructions()
    })

View Code

其中get_format_instructions指示我们如何将llm的输出进行格式化，需要注入到prompt中

补充1：两种引入prompt模板的方式其实最后都是走到langchain_core.prompts，如果要使用第二个，需要使用pip install langchain安装

from langchain_core.prompts import ChatPromptTemplate
from langchain.prompts import ChatPromptTemplate

View Code

补充2：目前的例子中我们对prompt提示语的输入参数都是在最后面invoke时填充进去的，还可以使用partial()逐步的填充提示语的输入参数

# 4. 创建模板
prompt_template = ChatPromptTemplate.from_messages(
    [
      ("system", "Answer the user query.\n{format_instructions}"),
      ("user", "{query}")
    ])

# 5. 在模板中部分填充输出要求
prompt_partial_filled = prompt_template.partial(
  format_instructions=parser.get_format_instructions()
)

# 6. 生成调用链
chain = prompt_partial_filled | chatmodel | parser

# 7. 调用模型
joke_query = "Tell me a joke."

chain.invoke({"query": joke_query})

View Code

三：将结果流式输出

将模型设为流式输出；
调用采用stream()而非invoke()；
从开始接收到输出时就逐一打印。

chatmodel = ChatOpenAI(
    streaming=True
)

prompt_template = ChatPromptTemplate.from_messages([
    ("system", "You are world class technical documentation writer."),
    ("user", "{query}")
])

output_parser = StrOutputParser()
chain = prompt_template | chatmodel | output_parser
response = chain.stream({"query": "what's generative ai?"})

for value in response:
print(value, end='', flush=True)    #end=''使得后续的输出会紧接着前面的输出；flush=True意味着每次print调用后，输出缓存都会被清空，确保value被直接显示。

View Code

四：使用OpenAI SDK调用其他兼容/非兼容模型

（一）模型完全兼容OpenAI SDK

采用更改 openai_api_base （alias base_url）和model_name来调用这些模型：

from langchain_openai import ChatOpenAI
api_key = userdata.get('deepseek')
base_url= 'https://api.deepseek.com/v1'
model_name='deepseek-chat'

chatmodel = ChatOpenAI(
     base_url=base_url,
     api_key=api_key,
     model_name=model_name)

chatmodel.invoke("what's generative ai?")

View Code

（二）模型没有完全兼容OpenAI SDK

需要有对应模型的SDK、API，调用对应模型的方法即可，以文心为例：

注册百度千帆账号，开启相关的模型服务，并充值。你需要获得 API KEY 与 API Secret。我们这里配置的是百度文心（ErnieBot）模型。
安装 Qianfan SDK：

 pip install qianfan

设置API key、secret
调用对应的SDK

from langchain_community.chat_models.baidu_qianfan_endpoint import QianfanChatEndpoint

chat = QianfanChatEndpoint(
    qianfan_ak = qf_api_key,
    qianfan_sk = qf_secrect_key,
)

chat([HumanMessage(content="hello there, who are you?")])

View Code

五：少样本模板的构建FewShotChatMessagePromptTemplate

大语言模型是“少样本学习者”（Few shot learner），它能够直接从我们在提示语中提供的样例中学习。除了手工模拟AIMessage和HumanMessage之外，还可以通过FewShotChatMessagePromptTemplate协助完成创建少样本。

1.创建少样本

from langchain_core.prompts import ChatPromptTemplate, FewShotChatMessagePromptTemplate
from langchain_openai import ChatOpenAI

examples = [
    {"input": "2+2", "output": "4"},
    {"input": "2+3", "output": "5"},
]

# This is a prompt template used to format each individual example.
example_prompt = ChatPromptTemplate.from_messages(
    [
        ("human", "{input}"),
        ("ai", "{output}"),
    ]
)
few_shot_prompt = FewShotChatMessagePromptTemplate(
    example_prompt=example_prompt,
    examples=examples,
)

print(few_shot_prompt.format())

View Code

2.添加少样本到message

final_prompt = ChatPromptTemplate.from_messages(
    [
        ("system", "You are a wondrous wizard of math."),
        few_shot_prompt,
        ("human", "{input}"),
    ]
)

print(final_prompt.format(input="What's the square of a triangle?"))

View Code

posted @ 2024-07-17 20:35 山上有风景阅读(155) 评论(0) 编辑收藏举报

刷新页面返回顶部

山上有风景

周围的人都比你厉害，你才会慢慢变强

LangChain补充一：一些小且有用的点

一：LangChain 表达式语言LCEL（LangChain Expression Language）

chain：我们可以将包括大模型调用在内的一组操作组成“链条”，即所谓“调用链”

（一）概念

（二）：通过LCEL实现多次调用模型

二：结合LCEL实现对输出的处理

补充1：两种引入prompt模板的方式其实最后都是走到langchain_core.prompts，如果要使用第二个，需要使用pip install langchain安装

补充2：目前的例子中我们对prompt提示语的输入参数都是在最后面invoke时填充进去的，还可以使用partial()逐步的填充提示语的输入参数

三：将结果流式输出

四：使用OpenAI SDK调用其他兼容/非兼容模型

（一）模型完全兼容OpenAI SDK

（二）模型没有完全兼容OpenAI SDK

五：少样本模板的构建FewShotChatMessagePromptTemplate

1.创建少样本

2.添加少样本到message

公告