DB-GPT：LLM应用的集大成者

整体架构

可以看到，DB-GPT把架构抽象为7层，自下而上分别为：

运行环境：支持本地/云端&单机/分布式等部署方式。顺便一提，RAY是蚂蚁深度参与的一个开源项目，所以对RAY功能的支持应该非常完善。

训练层：由子项目DB-GPT-Hub提供。以LLM为基，包含多种数据集和微调方法的微调框架。

协议层：AWEL（智能体编排语言），专为大模型应用开发设计的智能体工作流表达语言。

模块层：SMMF（多模型管理）、RAG（检索增强生成）、Agent（智能体）。

服务层：包含LLM、API、RAG在内的多个服务部署。

应用层：数据库对话、商业数据分析、知识库对话、表格对话等。

可视化层：输出样式，包含图表、工作流、文本的格式化输出等。

一、以RAG为核心的知识库问答

支持多文件格式、支持向量检索和稀疏检索，对海量结构化，非结构化数据做统一向量存储与检索。

二、以Chatdata为核心的数据问答

支持自然语言与Excel、数据库、数仓等多种数据源交互，分析报告，生成可视化图表。

三、统一的多模型管理服务

包括开源、API代理等几十种国内外大语言模型。

四、自动化微调框架

围绕大语言模型、Text2SQL数据集、LoRA/QLoRA/Pturning等微调方法构建的自动化微调轻量框架, 让TextSQL微调像流水线一样方便。

五、多智能体与插件

支持自定义插件执行任务，工作流自编排，原生支持Auto-GPT插件模型。

六、 隐私安全

通过私有化大模型、代理脱敏等多种技术保障数据的隐私安全。

不管是知识库问答、表格问答还是数据库对话，都可以把所有数据丢进去当成知识库，以此增强模型的能力。因此，RAG的一些技巧，比如混合检索和召回重排也就可以推广到其他应用上去了。

可以说现有的大模型应用已经离不开Agent，Agent包含的几大核心模块基本已经固定下来，剩下的工作就是如何简化Agent的工作流、自定义工作流编排、Agent执行过程可控等，如本项目中提到的AWEL和langchain-ai的LangGraph项目。

posted @ 2024-07-22 21:23 深度学习机器阅读(108) 评论(0) 编辑收藏举报

刷新页面返回顶部