论文阅读-ACL2024-Agent概览
template
论文名称:
作者:
所属单位:
关键词:
代码链接:
内容概述:
ChatDev: Communicative Agents for Software Development
- 作者:Chen Qian⋆ Wei Liu⋆ Hongzhang Liu♠ Nuo Chen⋆ Yufan Dang⋆ Jiahao Li⋆ Cheng Yang♣ Weize Chen⋆ Yusheng Su⋆ Xin Cong⋆ Juyuan Xu⋆ Dahai Li♦ Zhiyuan Liu⋆B Maosong Sun⋆B
- 所属单位:⋆ Tsinghua University ♠The University of Sydney ♣BUPT ♦Modelbest Inc.
- 关键词:多智能体合作、软件开发
- 代码链接:https://github.com/OpenBMB/ChatDev
- 内容概述:
软件开发是一项复杂的任务,需要具有不同技能的多个成员之间的合作。许多研究使用深度学习来改进瀑布模型中的特定阶段,例如设计、编码和测试。然而,每个阶段的深度学习模型都需要独特的设计,导致各个阶段的技术不一致,从而导致开发过程支离破碎且效率低下。在本文中,我们介绍了ChatDev,这是一个聊天驱动的软件开发框架,在这个框架中,由大型语言模型(LLM)驱动的专用代理被引导进行什么通信(通过聊天链)以及如何通信(通过通信去幻觉)。这些代理通过统一的基于语言的通信,积极参与设计,编码和测试阶段,并从他们的多轮对话中获得解决方案。我们发现,他们的自然语言的使用,有利于系统的设计,和编程语言的通信证明有助于调试。这个范例展示了语言交流如何促进多智能体协作,将语言建立为LLM智能体之间自主任务解决的统一桥梁。
Experiential Co-Learning of Software-Developing Agents
- 作者:Chen Qian†⋆ Yufan Dang†⋆ Jiahao Li♠ Wei Liu⋆ Zihao Xie⋆ Yifei Wang⋆ Weize Chen⋆ Cheng Yang♣B Xin Cong⋆ Xiaoyin Che♦ Zhiyuan Liu⋆B Maosong Sun⋆B
- 所属单位:⋆Tsinghua University ♠Dalian University of Technology ♣Beijing University of Posts and Telecommunications ♦Siemens
- 关键词:软件开发
- 代码链接:https://github.com/OpenBMB/ChatDev
- 内容概述:
大型语言模型(LLM)的最新进展给各个领域带来了重大变化,特别是通过LLM驱动的自治代理。一个代表性的场景是在软件开发中,LLM代理展示了有效的协作,任务分工和软件质量保证,显着减少了手动参与的需要。然而,这些代理经常独立地执行各种任务,而没有从过去的经验中受益,这导致了重复的错误和低效的尝试,在多步任务执行。为此,我们引入了体验式协同学习,一种新的LLM-Agent学习框架,在该框架中,教师和助理代理从他们的历史轨迹中收集捷径导向的经验,并将这些过去的经验用于未来的任务执行。大量的实验表明,该框架使智能体能够更有效地处理看不见的软件开发任务。我们预计,我们的见解将引导LLM代理增强自主性,并有助于他们在合作学习中的进化增长。
IBSEN: Director-Actor Agent Collaboration for Controllable and Interactive Drama Script Generation
- 作者:Senyu Han1, Lu Chen1,3*, Li-Min Lin2, Zhengshan Xu2, Kai Yu1,3
- 所属单位:1X-LANCE Lab, Department of Computer Science and Engineering MoE Key Lab of Artificial Intelligence, SJTU AI Institute Shanghai Jiao Tong University, Shanghai, China 2Department of Cultural Industry Management, School of Media and Communication Shanghai Jiao Tong University, Shanghai, China 3Suzhou Laboratory, Suzhou, China
- 关键词:
- 代码链接:https://github.com/OpenDFM/ibsen
- 内容概述:
大型语言模型已经证明了它们在故事情节创建和类人角色扮演方面的能力。现有的语言模型Agent主要关注个体层面的合理行为,难以在故事情节层面上约束其行为。在本文中,我们介绍了IBSEN,导演演员协调代理框架,生成戏剧剧本,使代理播放的情节更加可控。导演代理编写用户希望看到的情节大纲,指示演员代理角色扮演他们的角色,并在人类玩家参与场景时重新安排情节,以确保情节朝着目标发展。为了评估该框架,我们创建了一个新的戏剧情节,涉及到几个演员代理,并检查他们之间的相互作用的指导下,导演代理。评价结果表明,该框架可以从一个粗略的情节目标轮廓生成完整、多样的戏剧剧本,同时保持了戏剧人物的特点。
QueryAgent: A Reliable and Efficient Reasoning Framework with Environmental Feedback-based Self-Correction
- 作者:Xiang Huang1, Sitao Cheng∗†1, Shanshan Huang1, Jiayu Shen1, Yong Xu2, Chaoyun Zhang2, Yuzhong Qu1
- 所属单位:1State Key Laboratory for Novel Software Technology, Nanjing University, China 2Microsoft
- 关键词:知识问答(KBQA Knowledge Based Question Answer)
- 代码链接:https://github.com/cdhx/QueryAgent
- 内容概述
这篇文章介绍了一种名为QueryAgent的可靠且高效的推理框架,该框架利用环境反馈进行自校正。该框架旨在解决在使用大型语言模型、进行语义解析时遇到的可靠性和效率问题。文章表明,通过结合环境反馈和自校正,可以显著提高KBQA任务的可靠性和效率,特别是在处理复杂问题时。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 单元测试从入门到精通
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律