随笔 - 934, 文章 - 0, 评论 - 249, 阅读 - 345万

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

一年后AI可以做什么?

Posted on   蝈蝈俊  阅读(36)  评论(0编辑  收藏  举报

谷歌前CEO施密特被下架的斯坦福AI讲座中,给出了当前AI的三个重要发展方向是:

  • 更大的上下文窗口;
  • 更强大的AI代理;
  • 文本到行动能力的提升;

并认为在接下来的一年里就可以看到效果。

在讲解讨论文本到行动时,施密特用TikTok举的例子可以让我们清晰的看到未来AI可以做什么?

如果TikTok下架,你可以对AI系统说:

'为我创建一个TikTok的复制品,获取所有用户,获取所有音乐,加入我的偏好,在30秒内生成这个程序,发布它,

如果一小时内没有病毒式传播,就做些不同的事情。'

要能实现上面功能,一定有很多的Agent代理共同在工作,比如:

  • 分析限制策略,并绕过的下载爬虫;这个代码一定是AI自动产生的,并执行的,通用的爬虫程序无法满足需求。

  • 采集、评估指标、并根据指标进行优化的Agent大脑。

    这个能力去年我介绍 Auto-GPT 时就有人在做了,只不过长上下文保持与理解、推理深度、长时间任务管理的复杂性等问题限制了发展,随着技术进步,可预计会走向成熟。

制约这个能力达到的关键因素有这些:

推理和决策的局限性

上下文保持与理解:Auto-GPT 这类 Agent 在多个回合的任务执行中需要保持上下文,并进行长期的决策和推理。如果上下文太长,尤其是涉及复杂任务或长时间的对话时,会丢失上下文。

推理深度有限:虽然它们可以执行简单的任务和操作,但在面对复杂推理和多步决策时仍存在困难。需要进行更好的策略规划和执行。

行动执行的精确性

实际环境中的不确定性:从文本生成到实际行动的转化,尤其是在物理世界或具有复杂系统的操作中(如自动化工具控制、API调用等),依赖自然语言理解和生成的 Agent 往往难以精准执行。

工具使用的局限性:目前的 Agent 在调用外部工具或API时仍然依赖一定的规则配置,无法自主灵活应对每种情况,导致行动能力的局限。

长时间任务管理的复杂性

任务拆解与优先级管理:这些 Agent 在面对长时间、多步骤任务时,如何拆解任务、设定优先级、并行处理等,仍是一个挑战。这需要更多自动化的任务管理与调度能力。

安全性和鲁棒性问题

意外行为的防控:由于语言模型有时会生成意料之外的输出或采取意外行动,确保这些 Agent 的鲁棒性和安全性至关重要。当前尚没有完全可靠的方式避免不安全或无效行为。

误用风险:一些用户可能会错误使用或恶意利用这些 Agent 技术,因此需要更严格的安全限制和监管机制。

计算资源的需求

高算力要求:Auto-GPT 类的 Agent 通常需要大量的计算资源来执行推理、计划和生成,这限制了其大规模应用。对计算效率的优化以及如何更好地利用资源仍是发展的重要方向。

人机交互的流畅性

用户体验限制:这些 Agent 在与用户的互动中,有时不能很好地理解复杂指令或模糊指令,导致沟通的不流畅。这会影响实际应用的效果和用户的信任度。

多模态能力的缺乏

单一文本模式的限制:尽管Auto-GPT能够处理文本任务,但要扩展到多模态(如图像、音频、视频)能力,这种文本驱动的 Agent 在感知和理解多种信息形式上的能力仍有限。

目前多模态的LLM已经出现好久了,这个已经不是问题了。

上面这些制约因素,归根到底,又是施密特给出的当前AI的三个重要发展方向:

  • 更大的上下文窗口;
  • 更强大的AI代理;
  • 文本到行动能力的提升;

当达到这样能力时,就类似我之前说的:AI时代,就没有工程师或者设计师之分了,都是召唤师,对着AI念咒语,不同等级的召唤师使用不同法阵(AI产品)能召唤出来的产出也不一样

而这个能力达到的时间,谷歌前CEO施密特的判断是接下来的一年内。当这些技术大规模交付时,它们对世界的影响将超出人们的想象,可能比社交媒体的影响还要大。

相关博文:
阅读排行:
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 记一次.NET内存居高不下排查解决与启示
历史上的今天:
2012-08-20 Excel中PMT计算月供函数的java实现
2012-08-20 Android,两个互相影响的EditText如何避免死循环
2010-08-20 网站的功能测试
点击右上角即可分享
微信分享提示