世界最炙手可热的语音 AI 公司,举办了一场全球黑客松,冠军作品你可能已经看过

你估计刷到过上面这个视频,两个 AI 最初用人类自然语言交流,在确认彼此身份后,立刻切换到「哔哔哔哔」这种机器专属的 GGWave 通信方式。这个爆火全网的视频,就诞生于我们今天要介绍的 ElevenLabs Hackathon。
炙手可热的语音 AI 公司 ElevenLabs,凭借 30 亿美元的估值,在全球范围内掀起一股语音技术浪潮。其发起的语音 Hackathon 吸引了众多开发者踊跃参与,首届活动便汇聚了来自世界各地的数百名开发者和创造者,共同打造出超过 300 个 AI Agent。
RTE 开发者社区持续关注 Voice Agent 和语音驱动的下一代人机交互界面。如果你对此也有浓厚兴趣,也期待和更多开发者交流(每个月都有线上/线下 meetup,以及学习笔记分享),欢迎加入我们的社区微信群(方式见文末),一同探索人和 AI 的实时互动新范式。
01 全球冠军

GibberLink - Agent 通信协议

GibberLink 是一种通信协议,用于处理以下场景:
-
如果 AI Agent 与人类交谈,它就会坚持语音
-
如果 AI Agent 检测到另一边的 AI Agent,它就会建议切换到声级协议
-
如果另一个 AI Agent 接受该协议,它们将切换到声音级别协议(目前基于 GGWave 库)
开发者:Boris Starkov、Anton Pidkuiko (全球冠军)
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/622017-gibber-link
02 线上黑客松获奖者

为了让全球社区都能参与进来,ElevenLabs 在 Discord 服务器上组织了一场线上黑客松。来自世界各地、覆盖所有时区的数百名开发者热情加入,共同参与这场 Hackathon。
一等奖:Hugo - AI 旅行伴侣

Hugo 导游,你的 AI 旅行伙伴!它可以帮你规划行程、提供地道的当地信息、还能绘制旅行地图。让你在旅途中省时省力,同时解答文化和历史疑问,让旅途更充实。
开发者:Yilun Sun、Qiang Fang、David Chen、Aiden Zhao
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/622986-hugo-tour-guide
二等奖:Pep - 富有同理心的物理疗法 Agent

Pep 是你的富有同理心的物理治疗助手。作为一个多模式的语音和视觉助手,Pep 为患者提供实时指导,帮助他们坚持物理治疗锻炼计划。
开发者:Feng Yan、Lora Xie
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/622274-pep-your-compassionate-physical-therapy-agent
三等奖:Agent SFX

Agent SFX 是一套专为游戏开发者设计的工具集,用于生成游戏中的配音和音效。
它利用 fal.ai 上的视觉模型,分析游戏的节点结构和截图,进而生成开发者可直接使用的配音和音效。在黑客松期间,该解决方案最初是为开源的 Godot 游戏引擎构建的,但团队计划将其扩展到更多主流游戏引擎。
开发者:Arian Allenson Valdez、Maria Mikhaela Magpoc
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/621680-agent-sfx
03 合作伙伴奖项
除了 ElevenLabs 颁发的奖项外,他们的一些合作伙伴也额外提供了一些奖品:
1、全球 fal.ai 奖项

Playcade - AI 游戏开发者
这款 AI 游戏制作器旨在让游戏创作过程像玩游戏一样轻松有趣。
-
代码: AI 开发者将你的想法变为现实。立即预览你的游戏并根据反馈迭代改进。
-
美术: 利用 AI 生成的图像,提升游戏的视觉效果。简简单单的草图,胜过千言万语。
-
游戏: 与朋友分享你的作品,一起享受游戏乐趣。
-
想法: 如果你还没有明确的游戏构思,可以与我们的 AI 游戏设计师交流,帮你完善游戏创意。
开发者:Eve Silberman
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/622924-playcade-ai-game-builder
2、全球 PostHog 奖项

PostHog 会议助手
PostHog 会议助手是一位友好的语音助手,它可以加入你的会议,自动分享(甚至总结)关键的 PostHog 仪表盘和洞察。告别混乱的屏幕共享和为寻找某个数据点而陷入的尴尬沉默,让每次讨论都流畅且基于数据驱动。
不仅如此,我们还在开发更多实用功能:
-
无缝集成: 支持 Google Meet 和 Zoom 集成,助手可通过日历邀请自动加入你的所有线上会议。
-
即时查询: 搭载即时查询生成器,你可以提出任何不在已有洞察范围内的问题。它将根据用户输入生成并执行正确的 HogQL 查询语句。
开发者:Parth Gandhi、Ishaan Shrivastava
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/622175-posthog-meeting-copilot
3、全球 Lovable 奖项

Voyagr - 个人旅行专家
这个项目是一个创新的语音控制系统,旨在根据用户偏好搜索酒店和 API。它颠覆了传统的键盘和鼠标输入方式,转而利用先进的语音交互,引导用户流畅地完成搜索过程。系统会动态地提出具体问题,以收集必要的信息,从而提供高度个性化和高效的体验。
通过集成 ElevenLabs 对话 AI,项目实现了自然而灵敏的语音交互,即使不熟悉复杂搜索界面的用户也能轻松上手。无论是寻找住宿还是 API 服务,该系统都通过交互式的实时对话简化了搜索流程,显著提高了可访问性和易用性。
开发者:Mateusz Baranowski、Eryk Janiczek
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/621917-voyagr
04 线下活动
ElevenLabs 还分别在伦敦、纽约、旧金山、华沙、班加罗尔和首尔举办了六场线下活动。
获奖者,伦敦

1、GibberLink - Agent 通信协议
GibberLink 是一种通信协议,用于处理以下场景:
-
如果 AI Agent 与人类交谈,它就会坚持语音
-
如果 AI Agent 检测到另一边的 AI Agent,它就会建议切换到声级协议
-
如果另一个 AI Agent 接受该协议,它们将切换到声音级别协议(目前基于 GGWave 库)
开发者:Boris Starkov、Anton Pidkuiko (全球冠军)
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/622017-gibber-link
2、Espresso Labs - 以语音为主的数字助手
Espresso Labs 正在构建 Gary,一款以语音交互为主的数字助手,通过自动跟踪你的各项事务,帮助你更高效地完成任务,确保万无一失。
助手将整合来自 Slack、GitHub、电子邮件等不同渠道的信息,并通过对话提供更新。它还可以帮你记录待办事项,以便稍后处理,并能与日历、Todoist 等应用程序集成。
开发者:Ali Hussain、Leo Camacho 、John Lingi
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/622022-espresso-labs
3、Vox Populi - 使用语音互动的 3D 沙盘游戏
《Vox Populi》是一款 3D 游戏,其核心特色在于完全由 AI 生成的智能 Agent 和对话。你将扮演一位国王,而其他所有角色都是你的臣民。游戏围绕以下三个关键要素展开:
-
单次互动:使用语音进行对话,或直接命令你的臣民执行特定行动(例如互相攻击)。
-
群体互动:指挥一群 NPC 同时执行行动。
-
独特资产生成:与铁匠等角色协商,通过反复讨论,打造独一无二的盔甲或武器。
开发者:Matt Barty、Tabea Gallois
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/622677-vox-populi
获奖者,纽约

1、Unstuck - 无缝集成到任何网站的 AI 助手
Unstuck 是一款即插即用的解决方案,能够为您的 Web 应用无缝集成语音和聊天功能。它搭载强大的 AI 智能体,不仅能以可视化的方式呈现导航提示,还能提供实时的语音引导,为用户带来卓越的体验。Unstuck 能够深度学习您的网站结构,针对各种导航任务提供直观易用的支持。
开发者:Krish Mehta、Krish Shah 和 Freeman Jiang
项目链接:https://elevenlabs-worldwide-hackathon.devpost.com/submissions/622259-unstuck
2、Procuro - 采购自动化系统
Procuro 通过自动化繁琐的日常任务,如补货、争取最优新订单价格的谈判、自动生成采购订单文档以及追踪货物运输,有效解决了采购流程中的效率低下问题。它巧妙地利用 Twilio 和 ElevenLabs 的自动化呼叫功能,以及 Perplexity AI 的智能价格比较能力,从而显著简化了与供应商的互动流程。借助实时更新和动态仪表板,用户无需进行手动跟进,便可随时掌握最新信息。
开发者:Shrey Kakkar,Austin Wang,Prithvi 和 Kyle Zhang
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/622443-procuro
3、Show me how - 将隐藏的知识显性化,使其易于分享
ShowMeHow 将原本一对一的隐性知识分享方式转变为一对多的高效模式。只需录制一次,我们的 AI 就能实时指导无数用户完成任务,精确演示点击位置和操作步骤。
作者:Andrew Siah,Shubham Chandel,Iris M
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/622393-show-me-how
获奖者,旧金山

1、Dealwise - AI 智能砍价助手
Dealwise 是你的智能 AI 砍价助手。只需输入服务类型(例如「水管工」、「地毯清洁」)和邮政编码,智能助手即可:
-
搜索并列出 附近所有相关商家。
-
自动询价 ,逐一获取各家企业的报价。
-
生成比价表, 助你轻松选择最低报价并完成预订。
开发者:Yvonne Li 和 Jason Fan
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/621762-dealwise
2、Roadmate - AI 驾驶辅助
道路伴侣 AI 是一款智能驾驶安全平台,旨在预防疲劳驾驶引发的交通事故,并让您与亲友保持紧密联系。我们的智能模型由四个关键组件构成:
-
实时疲劳与路况监测 : 通过双摄像头实时分析面部特征和路况,即时检测驾驶员疲劳状态和潜在风险,从而增强驾驶安全性,有效预防事故发生。
-
AI 对话伴侣 : 由 ElevenLabs 提供技术支持的 AI 对话伴侣,可根据您的警觉程度调整对话内容——从轻松的兴趣闲聊到紧急唤醒提醒,时刻保持您的专注。
-
自动紧急联络系统 : 在紧急情况下,自动向您指定的联系人发送包含位置信息的更新和警报,确保及时获得援助。
-
个性化仪表盘 : 用户可以通过个性化仪表盘自定义安全偏好、设置喜欢的对话主题和管理紧急联系人,打造专属安全驾驶体验。
开发者:Anwar Mujeeb, Russell Semsem、William Xuan
项目链接:
https://devpost.com/software/roadmate-t28eqk
3、HIPPO - 评估对话质量,识别逻辑谬误,促进高效沟通
受到「河马效应」(HIPPO effect,即「最高薪酬者意见」主导讨论)的启发,我们致力于开发一款工具,旨在确保会议决策基于逻辑、公平和数据,而非层级和偏见。这款 AI 赋能的应用能够参与会议,分析其中的逻辑谬误、情绪动态以及发言平衡,从而促进更高效、更具包容性的对话。通过实时呈现客观洞察,我们帮助团队超越「河马效应」,实现真正的协作决策。
该应用能够接收会议的实时和批量音频,并分析其中的情绪、词汇密度、信息密度、贡献度以及逻辑谬误。
开发者:Annalece Mark、Jonathan Eicher、María Luque Anguita 、Jamie Martin
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/621308-hippo
获奖者,华沙

华沙的活动规模最大,在 Google for Startups Campus 有 120 名现场参与者,其中还包括了华沙市长拉法尔·特拉斯科夫斯基。
1、DeepSky - 航空安全语音 AI Agent
DeepSky 运用尖端 AI 技术,通过分析机载摄像头实时视频流,精准检测飞行器。它能识别潜在的碰撞风险,并结合 ElevenLabs 的低延迟文本转语音技术,为飞行员提供近乎实时的语音反馈,犹如在驾驶舱内增添了一双时刻警惕的眼睛。我们的系统解放了飞行员的精力,使其能够专注于飞行操控,而我们将负责不间断的风险扫描。
开发者:Maciek Malik、Bartosz Solka、Michal Pstrag
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/621930-deepsky
2、Claimsio - 将债务追收转化为合规、自动化的工作流程
我们通过电话和短信自动化债务追收流程,并计划拓展至更多渠道,并实现法院文件提交的自动化。在黑客马拉松期间,开发者们构建了一个精简的流程,能够追踪债务从初始记录到解决/谈判,直至通过 Stripe 完成支付的全过程。
开发者:Radek Bulat、Kuba
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/620968-claimsio
3、Voyagr - 个人旅行专家
这个项目是一个创新的语音控制系统,旨在根据用户偏好搜索酒店和 API。它颠覆了传统的键盘和鼠标输入方式,转而利用先进的语音交互,引导用户流畅地完成搜索过程。系统会动态地提出具体问题,以收集必要的信息,从而提供高度个性化和高效的体验。
通过集成 ElevenLabs 对话 AI,项目实现了自然而灵敏的语音交互,即使不熟悉复杂搜索界面的用户也能轻松上手。无论是寻找住宿还是 API 服务,该系统都通过交互式的实时对话简化了搜索流程,显著提高了可访问性和易用性。
开发者:Mateusz Baranowski、Eryk Janiczek
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/621917-voyagr
获奖者,班加罗尔

1、lossfunk - AI 电影生成器
只需提供一个提示,Hitchcock 的多智能体系统会首先调研输入内容,确保为您的故事编写的剧本在文化、历史和科学背景方面准确无误。
然后,它会详细描述故事中的场景,并确定适合的拍摄镜头。由 Fal.ai 提供支持的摄影指导 (DOP) 智能体随后将这些场景转化为逼真且准确的图像,并与故事板智能体进行反馈循环,以最终确定场景。
最后,由 Eleven Labs 赋能的旁白智能体将为视频配上恰如其分的声音,并将音频与画面完美同步。
开发者:Ayush Nangia、Adithya S K、Jayesh Sharma、Vikramjeet Singh
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/621602-lossfunk
2、ECHO AI - 个人语音助手
Echo AI 是一款个人语音助手,你可以在每晚睡前与它进行对话。对话结束后,它会:
-
生成当天的「情绪评分」
-
将会话中讨论的重要细节添加到其「长期记忆」中
-
记录你生活中的重要事件
-
在下次对话时,它会记住所有这些信息——包括你过去一周的感受、生活中发生的事情,以及你的情绪触发点。
此外,Echo AI 还采用经科学验证的方法来处理用户的焦虑、抑郁或不知所措等情绪。语音智能体根据具体情况,动态地选择向用户推荐哪种练习。目前提供的练习包括:呼吸练习、行为激活任务、扎根练习和渐进性肌肉放松。
开发者:Punarv Dinakar、Ajinkya Bodke、Pranav、Prathit Joshi
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/621569-echo-ai-artificially-intelligent
3、Adible - 为播客、AI 语音助手等平台提供无缝的广告集成体验。
Adible 主要支持以下两种广告集成方式:
-
对话式 AI 广告投放 : 我们分析上下文,并在您与语音 AI 实时交谈时,适时地将相关广告自然地融入对话流程中。
-
录音内容广告投放 : 我们分析播客、书籍朗读、讨论等录音内容,确定最佳广告插入位置,并选择合适的广告与录音内容相结合,然后将其插入到对话流程中。
开发者:Pochinki:Pradyumna Rahul、Nithin Kumar B、Ash Mirskar
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/621143-pochinki
获奖者,首尔

1、Voice Guardian - 用 AI 语音保护您的家
Voice Guardian 是一款由 AI 驱动的、基于语音的家庭安全系统,具备以下功能:
-
变声回应 : 将回应转化为预选的男性声音,以震慑入侵者。
-
AI 自动应答 : 根据用户预设的信息,与访客进行自然对话。
-
访客对话记录 : 记录并存储访客互动,以便监控和保障安全。
开发者:Kwon Yooji、Kim Jaemin、Lee Junyoung、Choi Changho
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/620614-voice-guardian
2、AMUSH - 多语言 AI 购物主持人
AI 购物主持人利用自动生成的多语言短视频和实时 AI 聊天支持,打破了全球电子商务的语言壁垒。卖家只需提供产品 URL,AI 即可提取详细信息,生成本地化的促销视频,并用多种语言解答客户咨询。这不仅助力企业拓展国际市场,更让消费者能够安心地使用母语进行购物。随着全球电子商务市场规模突破 10 万亿美元,AI 购物主持人正在弥合卖家和买家之间的差距,让跨境购物变得前所未有的轻松便捷。
开发者:Park Hyunah、Kim Sumin、Eun Jinsu、Ryu Jungwoo
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/620655-ai-multilingual-shopping-host
3、PrintMoneyAI - 一个对话式项目管理 Agent
PrintMoneyAI 告别了繁琐的手动客户挖掘和项目范围界定。它通过 AI 聊天自动安排客户会议,并利用 ElevenLabs 赋能的 AI 语音智能体进行深入的探索性会谈。客户可以直接与 AI 交流需求,AI 则能智能捕捉要点,自动将对话转化为详细的项目范围说明和任务分解。这让代理公司无需耗费大量时间进行客户挖掘,就能获得高质量的潜在客户和结构化的项目计划;同时,客户也能收到详尽的项目文档,从而加速交易达成。
开发者:Lucas Chae,Suzy Nam(Nam Suji),Ray Sun,Joseph Kim(Kim Yosep)
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/620647-printmoneyai-design-more-meet-less
原文:
https://elevenlabs.io/blog/announcing-the-winners-of-the-elevenlabs-worldwide-hackathon#0-global-top-prize

更多 Voice Agent 学习笔记:
对话 TalktoApps 创始人:Voice AI 提高了我五倍的生产力,语音输入是人机交互的未来
2024,语音 AI 元年;2025,Voice Agent 即将爆发丨年度报告发布
对话谷歌 Project Astra 研究主管:打造通用 AI 助理,主动视频交互和全双工对话是未来重点
这家语音 AI 公司新融资 2700 万美元,并预测了 2025 年语音技术趋势
Gemini 2.0 来了,这些 Voice Agent 开发者早已开始探索……

【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列1:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
· 【杂谈】分布式事务——高大上的无用知识?
2024-03-06 ChatGPT 新增朗读功能;微软 Win11 鼠标悬停自动打开 Copilot 丨 RTE 开发者日报 Vol.158