Fork me on GitHub

使用 MRKL 系统跨越神经符号鸿沟

本文展示了自然语言处理的下一步发展——模块化推理、知识和语言( the Modular Reasoning, Knowledge and Language,简称为MRKL)系统以及LangChain和Semantic Kernel的实现。 MRKL 系统包括一个或多个语言模型,并通过外部知识源和符号推理专家来增强它们,这些专家可以处理神经模型无法处理的任务。

什么是 MRKL 系统?

ChatGPT、GPT-4 等超级模型确实令人惊叹,并开启了令人兴奋的机会。 但这些模型也有内在的局限性。 例如无法访问公司的数据库,无法访问当前信息(例如,最新的 天气 或美元兑欧元汇率),无法推理(例如,他们的算术能力无法与之媲美1970 年代的 HP 计算器),更新成本高得令人望而却步。
像 LangChain的Agent (https://github.com/hwchase17/langchain/tree/master/langchain/agents/mrkl) 和Semantic Kernel的 Planner(https://github.com/kaza/sk-iterative-planner)这样的 MRKL 系统享有大型语言模型的所有优点。 以下是它的工作原理,参见:https://learnprompting.org/zh-Hans/docs/advanced_applications/mrkl

MRKL
当然,要完成所有这些工作还有很多细节和挑战 ,比如训练离散专家、平滑他们与神经网络之间的接口、在不同模块之间进行路由等等。 要更深入地了解 MRKL 系统、它们如何适应技术领域以及实施它们时遇到的一些技术挑战,请参阅MRKL 论文。论文地址:https://arxiv.org/pdf/2204.10019.pdf

以下是它提供的一些功能。

  • 以自由语言阅读和更新您的数据库
  • 人工智能辅助时事内容生成
  • 执行简单和复杂的数学运算。
  • 分解多步问题
  • 访问不断变化的信息(天气、货币汇率)
  • 透明度和信任
posted @ 2023-05-14 21:28  张善友  阅读(628)  评论(2编辑  收藏  举报