智能体开发

一、大模型开发背景
1、大模型的工作原理
开始用户输入 Prompt构建迭代输出终止符结束
2、大模型的固有缺陷
不具备知识出现幻觉、无法解决复杂逻辑任务、不擅长数学运算
如何解决大模型的固有缺陷：使用外接知识库给LLM提供知识、多个LLM协同各司其职、使用外接工具如计算器等
3、什么是大模型开发
·开放的大模型AP1、本地部署的开源大模型
开放API如:GPT-40、GLM、Qwen 本地部署如:GLM、Qwen、InternLM
·外接知识库、外接专业工具外接搜索引擎、天气查询、代码书写等接口
·Prompt工程及流程化
如何控制智能体的交互流程、如何构建Prompt使大模型更好地发挥作用
4、现有开发范式
检索增强生成(RAG)与AI Agent
5、如何调用OpenAIGPT3&4模型 API?
1.用openai库调用:
2.requests原生请求:
二、Prompt工程
主流Prompt工程
一）Few-shot
使用少量例子给LLM作为上提示
二）CoT
思维链，让LLM有思考的过程
三）Zero-shot
不使用例子输入，仅使用指令
四）可控生成
是用Prompt控制LLM生成我们想要的格式，方便后期进行解析
三、检索加强生成
文本向量
结构化数据非结构化数据
可计算不可计算
方法：One-hot整数编码（word embedding词义相似时，在空间上也相近）
四、大模型智能体

如何利用LLM搭建自己的AI智能助手?
步骤:
1.获取LLM:国外:GPT4o比较便宜国内:阿里的通义千问，智谱AI的GLM 都是有开源可以自己运行，也可以调用API使用
2.工具包开发:如刚刚提到的网页搜索、代码生成等，在此期间，需要将工具包的描述书写清楚，以便于LLM解析，(如:调用工具包需要的参数及描述)
3.提示词设计:
Tools:1.搜索引擎，输入参数:query返回信息类型:字符串工具描述:通过搜索引整获取用户需要的信息2.代码生成,
4.处理模型的回答:ILM返回的数据中，包含了是否使用工具等信息，如果没有则将LLM返回的消息直接显示给用户如果有，则根据LLM返回的固定格式信息(如ison)解析出来作为参数调用对应的工具包，将工具包返回的信息输入到LLM中并告知这是调用该工具包返回的结果。最后将LLM的输出返回给用户