智能体开发

一、大模型开发背景
1、大模型的工作原理
开始 用户输入 Prompt构建 迭代输出 终止符结束
2、大模型的固有缺陷
不具备知识出现幻觉、无法解决复杂逻辑任务、不擅长数学运算
如何解决大模型的固有缺陷:使用外接知识库给LLM提供知识、多个LLM协同各司其职、使用外接工具如计算器等
3、什么是大模型开发
·开放的大模型AP1、本地部署的开源大模型
开放API如:GPT-40、GLM、Qwen 本地部署如:GLM、Qwen、InternLM
·外接知识库、外接专业工具外接搜索引擎、天气查询、代码书写等接口
·Prompt工程及流程化
如何控制智能体的交互流程、如何构建Prompt使大模型更好地发挥作用
4、现有开发范式
检索增强生成(RAG)与AI Agent
5、如何调用OpenAIGPT3&4模型 API?
1.用openai库调用:
2.requests原生请求:
二、Prompt工程
主流Prompt工程
一)Few-shot
使用少量例子给LLM作为上提示
二)CoT
思维链,让LLM有思考的过程
三)Zero-shot
不使用例子输入,仅使用指令
四)可控生成
是用Prompt控制LLM生成我们想要的格式,方便后期进行解析
三、检索加强生成
文本 向量
结构化数据 非结构化数据
可计算 不可计算
方法:One-hot整数编码(word embedding词义相似时,在空间上也相近)
四、大模型智能体

如何利用LLM搭建自己的AI智能助手?
步骤:
1.获取LLM:国外:GPT4o比较便宜国内:阿里的通义千问,智谱AI的GLM 都是有开源可以自己运行,也可以调用API使用
2.工具包开发:如刚刚提到的 网页搜索、代码生成等,在此期间,需要将工具包的描述书写清楚,以便于LLM解析,(如:调用工具包需要的参数及描述)
3.提示词设计:
Tools:1.搜索引擎,输入参数:query返回信息类型:字符串工具描述:通过搜索引整获取用户需要的信息2.代码生成,
4.处理模型的回答:ILM返回的数据中,包含了是否使用工具等信息,如果没有则将LLM返回的消息直接显示给用户如果有,则根据LLM返回的固定格式信息(如ison)解析出来作为参数调用对应的工具包,将工具包返回的信息输入到LLM中并告知这是调用该工具包返回的结果。最后将LLM的输出返回给用户

posted @   无语了666  阅读(67)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?
· 展开说说关于C#中ORM框架的用法!
点击右上角即可分享
微信分享提示