定义人工智能未来的8项设计突破

定义人工智能未来的8项设计突破

关键界面决策如何塑造人机交互的新时代

帕特里克·摩根

使用 Midjourney 生成

界面设计师正在探索未知的领域。

十多年来,我们第一次面对真正意义上的空白领域,在用户体验设计上没有可供参考的手册,也没有成熟的模式可以依赖。即便是最前沿的人工智能实验室,也都是在不断实验中学习,观察着哪些交互方式能够引起共鸣。

这个时刻让我想起了触控式移动界面刚刚兴起的时代,设计师们那时候正在积极创造如今我们习以为常的交互模式。正如早期 iOS 和 Android 的设计选择塑造了移动计算的时代,今天的突破正在定义我们未来与 AI 合作的方式,并将持续多年影响这个领域。

看到这些设计决策在整个生态系统中实时传播,真的很有趣。当某种模式奏效时,竞争对手会迅速效仿——这并不是偷懒,而是因为我们都在共同探索,在这个新的范式下,什么才是合理的交互方式。

在这个充满未知的时刻,新的主流模式正在逐步成型。今天,我想重点介绍那些最让我着迷的突破——它们正在塑造我们对 AI 交互的集体认知。有些现在看来已经很明显了,但它们每一个都代表着一个关键的发现时刻,是帮助我们更好理解人与 AI 如何协作的成功实验。

通过研究这些有影响力的模式,我们可以超越简单地复制已有的成功案例,真正去塑造 AI 界面的未来发展方向。

突破点

  1. 对话范式(ChatGPT)

关键洞察: 人类本来就知道如何通过对话表达复杂的想法——为什么还要让他们学习别的方式?

影响: 确立了“对话”作为人与 AI 交互的基本范式

现在我们已经习惯了聊天式界面,甚至几乎不会特意去思考它,但正是这个突破将我们带入了当前的 AI 时代。

其实 GPT 早就可以在 OpenAI 的开发者控制台中使用,但那个界面并没有引起广泛关注。它看起来更像是一个普通的开发工具。我记得当时玩过几次,觉得很厉害,但没有真正激发我的想象力。

然而,决定把底层技术转变成对话形式,彻底改变了一切。有趣的是,我猜 OpenAI 自己可能也没想太多这件事——不然他们不会给它取名“ChatGPT”这么直白的名字。如果他们意识到自己在打造一个革命性的消费级产品,可能会选择更有格调的品牌名称。但事实证明,这个设计决定成为了这一代 AI 工具最重要的突破之一。

如今,聊天界面已经被广泛模仿,几乎所有面向消费者的 AI 工具都受到了它的影响。

我原本以为聊天界面最终会被淘汰,但现在我不这么认为了。这一整波生成式 AI 工具的核心就是自然语言,而“对话”正是基于语言交流的核心机制。那些生硬的聊天机器人或许会不断进化,但“对话”本身将会长期作为基础交互模式存在。

  1. 信息来源透明化(Perplexity)

关键洞察: 如果用户看不到信息来源,就无法验证 AI 回答的可靠性

影响: 设定了 AI 在搜索和研究工具中的可验证性新标准

当人们开始频繁使用 ChatGPT 后,一个普遍的抱怨点就是——它没有提供来源。GPT 可以基于庞大的训练数据生成回答,但用户根本无从得知这些信息的出处,这让它在正规研究中难以使用。

Perplexity 通过引入 AI 响应的实时引用功能改变了这一局面,使答案变得可追溯、可验证。这一功能后来被大量复制,包括 OpenAI 也在 ChatGPT 的网页搜索集成功能中采用了类似的做法。

这解决了一个根本性的信任问题:用户不仅需要答案,更需要知道答案的来源,以建立对 AI 的信心。

这个突破对于将 AI 作为新型搜索引擎来说至关重要,但实际上 AI 的能力远不止于搜索。大语言模型不仅可以增强像 Perplexity 这样的问答工具,还能开启全新的创造性工作流。

  1. 创意整合(Claude Artifacts)

关键洞察: 对话不仅仅是用来生成文本——它还能驱动结构化、可复用的内容创作

影响: 让对话成为新型创意工作流的核心环节

当我第一次使用 Claude 的“Artifacts”(人工制品)功能时,我感觉自己不再只是单纯和 AI 聊天,而是真的在“与 AI 共同创造”。

之前,我用 ChatGPT 和 Claude 进行过头脑风暴,觉得很有价值;我也用 Perplexity 做过研究,觉得很有帮助。但“Artifacts” 给了我一个“顿悟时刻”——原来我可以用对话来启动创意工作流,并将最好的部分转换成可导出、可复用的成果。

当然,目前这种基于对话的内容创作循环还不够完善,后续的工作流还需要进一步打通,但我们正在朝着这个方向前进。

对我来说,Artifacts 证明了 AI 协作将成为新的创意核心流程,改变了我对 AI 交互的认知方式:AI 不再只是“辅助工具”,而是对话的核心驱动力,和我一起生成、打磨创意输出。AI 不只是我的“助手”或“副驾”——它越来越像是主导者。

  1. 自然交互(语音输入)

关键洞察: 语音比打字更自然,能表达更丰富的信息

影响: 降低了与 AI 交互时提供详细背景信息的门槛

很多人还没有重视“语音输入”这一交互方式。我觉得大家对它的信任度不高,主要是因为我们经历了一代糟糕的语音助手(没错,就是说你呢,Siri)。

但现实是,如今 AI 语音转录的准确率已经非常高了。

语音输入很重要,因为它能让你真正使用自然语言交流。人们常常忽略一个事实:一旦我们开始打字,就会有意无意地“编辑”自己的表达。而说话则能让大脑完全进入即兴创作模式,AI 也能从中捕捉更丰富的上下文信息——这正是 LLM 最擅长处理的内容。

我知道有些人可能会害羞,担心口语表达太乱,比如有很多“嗯”“啊”之类的停顿。但我可以告诉你,AI 完全不在意,它会自动过滤掉这些杂音,并关注真正的内容。

最终,语音输入会成为一种更自然、更高效的创意表达方式。我对“口述创作”作为未来一代人的核心技能非常看好。如果你还不习惯这种方式,现在就该开始练习了。

  1. 工作流整合(Cursor IDE)

关键洞察: 深度嵌入 AI 能极大提升用户在已有工作环境中的效率

影响: 将代码编辑器转变为 AI 驱动的创意环境

Cursor 让我第一次真正感受到 AI 主导的创意工作流,这种体验直接融入了我已有的代码库之中。它的一些功能让我觉得理所当然——“当然,IDE 应该有这种功能” 的那种感觉,比如它强大的“Tab 自动补全”功能。

虽然我早年曾是专业的 UI 开发者,但这些年已经很久没有经常写代码了。重新拾起编程对我来说一直是个挑战,因为总会卡在新的语法或者不熟悉的框架特性上。Cursor 这样的工具帮我绕过了许多这些障碍。

比如,当你打开一个已有的代码库时,很容易因为不熟悉其结构而感到不知所措,不知道有哪些可用的组件,或者不知道某段代码具体在做什么。有了 Cursor,我可以直接提问,快速获得清晰的解释,不再被这些问题卡住。

Cursor 还让我进一步意识到,让 AI 直接读取和写入文件系统是多么强大。Claude 确实很棒,但它的输出总需要额外的步骤才能导入到我的项目中。而 Cursor 这样的工具,AI 生成的代码会直接出现在最终的目标文件中,使整个工作流更加紧凑高效。

  1. 环境级 AI 帮助(X 平台的 Grok 按钮)

关键洞察: 用户最需要 AI 帮助的时刻,往往是他们遇到不理解的信息时

影响: 让 AI 助手能够在信息环境中即时提供背景解析

Grok 按钮的实用性让我感到意外。在 X(前 Twitter) 的信息流中,充斥着海量的内容,我经常会因为缺少背景信息而难以完全理解某条推文的含义。

Grok AI 按钮直接集成到内容层级,使我可以一键获取实时的上下文解析,不管是梗图、新闻标题,还是其他任何信息,它都能帮我更好地理解。

我觉得这种 AI 帮助模式未来会变得越来越重要,特别是在当下,网上的内容越来越需要解读(比如:这条信息是 AI 生成的吗?它的发布者是谁?他们是否有偏见?他们想要如何影响我?)。

当然,Grok 按钮目前还是一个新功能,而且就像 X 平台的许多设计一样,它的执行方式还有很多改进空间。但用了一段时间后,我发现自己竟然希望在其他网站上也能有类似的“即时背景解析”按钮。

最终,我觉得这种功能会被操作系统级别的 AI 助手(比如 Gemini、Siri 等)整合进去,但 Grok 按钮已经很好地展示了,当 AI 被合理地嵌入环境中,它可以提供多么有价值的帮助。

  1. 过程透明化(Deepseek)

关键洞察: 展示 AI 生成答案的思考过程,能增强用户的信任感和理解能力

影响: 通过可视化推理,让 AI 回答更具人性化和可信度

这个名单上最“新鲜”的突破点是 Deepseek,它最近凭借发布的 R1 推理模型在互联网上引发了热议。

虽然 Deepseek 不是市场上第一个“可解释 AI” 模型,但它做了一个关键的设计选择:让 AI 的“思考过程”变得可见。

这一设计引起了广泛关注,因为它展示了 AI 是如何得出答案的,而它的推理语言看起来竟然和人类的思考方式很相似。这种透明度增强了用户对 AI 结果的信任——用户可以自己判断 AI 的思考路径是否合理。

另外,这种“思考过程”本身也可能包含有价值的内容,比如,AI 在推理过程中可能会浮现一些有趣的观点,而这些观点本身可能值得进一步探索。

这让我想起了网页应用中“进度条”的重要性。如果某个操作瞬间完成,用户会觉得突兀;但如果它运行得很慢,又没有任何反馈,用户可能会怀疑是不是出错了。进度条的作用就是缓解这种焦虑,帮助用户理解机器的工作状态。

AI 透明化推理的作用很类似——它让用户确信 AI 确实在“思考”。

未来,我觉得 AI 的推理过程可能不需要默认展示,但至少应该有一个清晰的访问方式,让用户可以随时查看 AI 的思维路径。

  1. 交互界面延迟(Midjourney)

关键洞察: 优先把核心技术打磨好,比一开始就打造一个精致的界面更重要

影响: 证明了“先专注于能力,再考虑 UI 设计” 能带来更明智的界面决策

在各种设计讨论中,我们往往都在关注“视觉界面”,而 Midjourney 的策略让我眼前一亮。

这家公司在早期决定不构建一个独立的 UI,而是直接依托 Discord 进行交互,这一选择既有趣又具有战略性。

尽管 Midjourney 是一款面向视觉创作者的工具,但它的核心产品其实是 AI 生成图像的技术本身——这才是一切的基础。如果它的 AI 能力不够强,无论 UI 设计得多漂亮都没用。

如今 Midjourney 已经推出了网页版 UI,但当初选择不构建自有界面,让他们能够把全部精力集中在打磨 AI 模型上。他们的 Discord 交互方式也间接控制了产品的早期用户群体——毕竟,不是所有普通用户都会愿意跑到 Discord 上去用 AI 画图(包括我在内)。

此外,这种社区驱动的交互方式,还帮助他们收集了大量宝贵的用户反馈,为后续的产品决策提供了更有价值的信息。

所以,如果你正在开发 AI 产品,Midjourney 的案例告诉我们——有时候,不去做 UI 本身也是一种战略性的设计选择。

最后的思考

这 8 个突破,不仅仅是巧妙的 UI 设计决策——它们是人类与机器协作方式的新篇章。每一个突破点,都是某个设计师或工程师敢于尝试未验证概念的结果,他们找到了一种与 AI 互动的方式,并让它成为了标准。

从 ChatGPT 让 AI 变得像“对话”,到 Claude 让 AI 变得像“创作伙伴”,再到 Deepseek 让 AI 展示它的“思考过程”——我们正在见证一个全新的创意媒介的快速演进。甚至像 Midjourney 这样选择不构建 UI 的决定,也在提醒我们——所有我们以为理所当然的软件设计原则,都可以被重新思考。

创新的步伐没有放慢,反而越来越快。而这正是这个时代最激动人心的地方:我们不仅仅是观察者,我们是参与者。

每一个正在从事 AI 设计、开发、创作的人,都有机会塑造这门新兴的人机交互语言。

最基础的积木已经摆在桌面上。问题不只是“你会用它们搭建什么?”,更是“你能发现哪些新的积木和模式?”

我很想听听你对这些突破的看法,或者你最近观察到哪些新兴的交互趋势。你的洞见,或许就会成为下一个重要的设计突破。

posted @   果冻人工智能  阅读(30)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· 清华大学推出第四讲使用 DeepSeek + DeepResearch 让科研像聊天一样简单!
· 实操Deepseek接入个人知识库
· 易语言 —— 开山篇
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
点击右上角即可分享
微信分享提示