HUSKY:一个优化大语言模型多步推理的新代理框架

推理被高度认可为生成人工智能的下一个前沿领域。通过推理，我们可以将任务分解为更小的子集并单独解决这些子集。例如以前的论文：思维链、思维树、思维骨架和反射，都是最近解决LLM推理能力的一些技术。此外推理还涉及一些外围功能，例如访问外部数据或工具。在最近的几年里，我们已经看到模型在特定的推理技术中表现得非常好，但它们无法跨领域推广。这是Meta AI、Allen Institute of AI和University of Washington的研究人员在最近一篇论文中所要解决的问题。

HUSKY是一个开源语言代理，设计用于处理各种复杂的任务，包括数字、表格和基于知识的推理。与其他专注于特定任务或使用专有模型的代理不同，HUSKY在统一的框架内运行。它分为两个阶段:1、生成解决任务所需的下一个行动;2、它使用专家模型执行此操作，并在此过程中更新解决方案。

这个框架的名字来源于 “哈士奇”因为雪橇犬在拉雪橇时是一起来合作前进的，并且在前进的过程中要针对路面情况有自己的判断和决定，这非常符合这个代理的工作思路。但是看到这个名字我总感觉这个代理不太聪明的样子。

https://avoid.overfit.cn/post/9c05e34dc60645bfb6f6a47df294b5e8

posted @ 2024-06-21 11:01 deephub 阅读(61) 评论(0) 收藏举报

刷新页面返回顶部

deephub

overfit深度学习

HUSKY:一个优化大语言模型多步推理的新代理框架

公告