深度使用ChatGPT六个月后,OpenAI最大的金融客户评估:有效果,但扩展性存疑
来源:华尔街见闻 根据用户报告,银行各部门的生产力的确有所提高,80% 的用户表示 ChatGPT Enterprise 每周可以帮助他们节省超过两个小时的工作时间。然而,将 ChatGPT 整合到银行复杂的内部系统和数据库中可能会面临困难。 西班牙第二大银行说,ChatGPT 企业版能带来“创造力
RAG没有银弹!四级难度,最新综述覆盖数据集、解决方案,教你「LLM+外部数据」的正确使用姿势
新智元报道 编辑:LRS 论文提出了一种 RAG 任务分类法,将用户查询分为四个级别,并讨论了将外部数据集成到 LLMs 中的三种主要方式。从简单的事实检索到复杂的推理任务,每个级别都有其独特的难点和解决方案,需要不同的技术和方法来优化性能。 受参数量和知识更新的限制,大模型在执行很多真实场景下的任
宝可梦GO「偷家」李飞飞空间智能?全球最强3D地图诞生,150万亿参数解锁现实边界
新智元报道 编辑:HYZ 5 年,5000 万个神经网络,这个世界从未被扫描过的角落,我们都能看到了。宝可梦 GO 团队,竟然抢先实现了李飞飞的「空间智能」?而「Pokémon Go」的玩家可能没想到,自己居然在训练着一个巨大的 AI 模型。 李飞飞提出的「空间智能」概念,被宝可梦 GO 团队抢先实
续命Scaling Law?世界模型GPT-4o让智能体超级规划,OSU华人一作
新智元报道 编辑:编辑部 HZh Scaling Law 撞墙,扩展语言智能体的推理时计算实在太难了!破局之道,竟是使用 LLM 作为世界模型?OSU 华人团队发现,使用 GPT-4o 作为世界模型来支持复杂环境中的规划,潜力巨大。 Scaling Law 又能续命了? 如何通过语言智能体的高级规划
机器人训练数据不缺了!英伟达团队推出DexMG:数据增强200倍
新智元报道 编辑:静音十二 最近,Jim Fan 参与的一项研究推出了自动化数据生成系统 DexMimicGen。该系统可基于少量人类演示,合成类人机器人的灵巧手运动轨迹,解决了训练数据集的获取难题,而且还提升了实验中机器人的表现。 要知道,大规模、优质的机器人训练数据集的获取往往非常有挑战性。 不
首个可保留情感的音频LLM!Meta开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
新智元报道 编辑:LRS Meta 最近开源了一个 7B 尺寸的 Spirit LM 的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。 在纯文本大模型取得进展的同时,其他模态数据,如语音与文本结
5年浴火,800余岁巴黎圣母院重生!马斯克激动转发,AI数字建模创奇迹
新智元报道 编辑:桃子 时隔 5 年,巴黎圣母院终于完成修复,将在 12 月 7 日重新开放。在这场耗资数亿欧元的浩大工程中,3D 建模等关键 AI 技术发挥了关键作用,让历经 800 多年沧桑的教堂与现代科技完美融合。 历时 5 年,巴黎圣母院终于重生了! 重建后的内部景观,再次闪烁着这座历经数百
英特尔错失AI芯片浪潮,从放弃收购英伟达开始
新智元报道 编辑:乔杨 几十年来,英特尔一直是硅谷占主导地位的芯片厂家。但错失大好时机,加上糟糕的执行力,让这家公司在科技行业如火如荼的 AI 淘金热中被迫退居观望状态。 对于从 PC 时代走到 GenAI 热潮的人,「英特尔」是一个极其割裂的存在。 印象中,「英特尔」曾经代表着硅谷神话、芯片霸主,
美国教授痛心:UC伯克利GPA 4.0计算机本科生,毕业即失业?ML博士直呼太卷后悔转行
新智元报道 编辑:Aeneas 好困 UC 伯克利计算机系 GPA 4.0 的本科生,居然毕业即失业?三四十岁的科技行业中年人,也躲不过席卷而来的裁员大潮。甚至机器学习在读博士也表示卷到飞起,看到曾经的同学,痛心直言后悔从 EE 转行 CS。 美国学计算机的应届大学生,也是毕业即失业? 这个现象,震
一只暹罗猫竟是论文作者!谷歌学术20岁,创始人首次公开最魔幻学术故事
新智元报道 编辑:静音 今年是谷歌学术创立 20 周年,创始人们特意为此撰写了一篇博客,回顾了谷歌学术的成长历程,并分享了一些实用的使用技巧和背后的趣闻轶事。在 AI 浪潮席卷而来之际,谷歌学术将如何站稳脚跟? 全球最大、最全面的学术搜索引擎,非谷歌学术(Google Scholar)莫属。 根据网
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
衡宇发自凹非寺 量子位公众号 QbitAI What??? 一直低调行事的国内初创公司,旗下模型悄悄地跃升成国内第一、世界第五(仅排在 o1 系列和 Claude 3.5 之后)! 而且是前十名中的唯一一家国产公司。 (该榜上国产第二名是阿里开源的 qwen2.5-72b-instruct,总榜第
DeepSeek版o1炸场,数学代码超越OpenAI,每天免费玩50次
西风发自凹非寺 量子位公众号 QbitAI DeepSeek 版 o1 来了,发布即上线,现在就能玩! 模型名为DeepSeek-R1-Lite,预览版在难度较高数学和代码任务上超越 o1-preview,大幅领先 GPT-4o 等。 据了解,DeepSeek-R1-Lite 使用强化学习训练,推理
国产4o大模型,秒懂国风李子柒
金磊发自凹非寺 量子位公众号 QbitAI 又一个国产版《Her》,就这么水灵灵地来了。 作为一个实时语音对话的功能,效果好不好,实测见分晓。 我们直接以近期的大热点——李子柒复出作为话题,来上一番对话: 视频地址:https://mp.weixin.qq.com/s/-NOVIKDsBq_7Ts3
多样任务真实数据,大模型在线购物基准Shopping MMLU开源
谁是在线购物领域最强大模型?也有评测基准了。 基于真实在线购物数据,电商巨头亚马逊终于“亮剑”—— 联合香港科技大学、圣母大学构建了一个大规模、多任务评测基准 Shopping MMLU,用以评估大语言模型在在线购物领域的能力与潜力。 一直以来,想要完整建模在线购物相当复杂,主要痛点是: 多任务性:
特斯联首款通用智能体发布,实现对物理世界的高维感知
允中发自凹非寺 量子位公众号 QbitAI 智能时代交互的不断演进,催生了“超级人工智能即服务”(IaaS,Intelligence as a Service)的全新商业模式。 在此基础之上,并创造了一系列由 IaaS 驱动的全新智能服务,智能体(AI Agent)即为其中的代表。 在有着科技界奥林
AI版《黑客帝国》:无限生成逼真视频,3A画质,还能实时交互
金磊发自凹非寺 量子位公众号 QbitAI 人类离电影《黑客帝国》的场景,似乎又近了一步。 因为就在刚刚,一个与电影同名的、首个 AI 基础世界模拟器——The Matrix 问世。 它已经可以实现生成无限长、高保真 720p 真实场景视频,而且还是可以实时交互的那种! 话不多说,直接来看一个长达
OpenAI重夺竞技场第一,但这波靠的是4o
鱼羊发自凹非寺 量子位公众号 QbitAI OpenAI 开发者日新加坡站今天启幕,果不其然,ChatGPT 又出手了: Gemini 刚在竞技场头把交椅上坐了不到一周,最新版 ChatGPT 轻轻一更新,第一再次易主。 对,还不是 o1 满血版,而是新版 4o。 具体来说,此番 GPT-4o 更新
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
允中发自凹非寺 量子位公众号 QbitAI 新的大语言模型(LLM)评估基准对于跟上大语言模型的快速发展至关重要。 近日,淘宝天猫集团的研究者们提出了中文简短问答(Chinese SimpleQA),这是首个全面的中文基准,具有“中文、多样性、高质量、静态、易于评估”五个特性,用于评估语言模型回答简
汽车上的《Her》:模型竟然想做个人了,甩掉机械感,来自吉利
允中发自凹非寺 量子位公众号 QbitAI 今天,如果你身边有这样一个对话大模型,它就像你身边的一个朋友,快言快语,风趣幽默,既会比喻,又会自嘲,偶尔跟你唱反调,你跟它的聊天欲望会不会更强一些呢? 直接来看看实际表现: 类似的设计灵感来源于电影《Her》里面的 Samantha——作为关于 AI 的
陶哲轩宣布“等式理论计划”成功,57天完成2200万+数学关系证明
57 天,人类和 AI 合作搞定了 4694 个等式之间 22028942 个蕴含关系! 大神陶哲轩激动宣布:等式理论计划,成功。 “等式理论计划”,由陶哲轩本人在 2024 年 9 月 25 日发起,目的是探索按蕴含关系排序的原群(magma)等式理论空间。 特别的是,在这个项目里,陶哲轩不仅集合
40亿美元!Anthropic再获亚马逊新投资,双方正合作开发AI芯片
官宣了!Anthropic 又从亚马逊拿了 40 亿美元(约 289.83 亿人民币)! 消息一出,AI 圈立即开启了刷屏模式: 这是继去年 9 月亚马逊向 Anthropic 投资 40 亿美元后的第二笔,两次合计 80 亿美元。 作为交易的一部分,AWS(亚马逊云平台)将成为 Anthropic
阿里布阵“反内卷、谋增长”,电商良币时代加速到来
作者丨雪豹财经社瀚星 一家千亿美元市值公司做的每一个决定,所产生的影响都不局限于公司本身,而是带动整个行业发生变化。 11 月 21 日,阿里巴巴集团 CEO 吴泳铭发布内部邮件,宣布整合国内和海外电商两大业务,成立电商事业群,由蒋凡出任 CEO,直接向吴泳铭汇报。 吴泳铭表示,中国和全球的电商业态
特斯拉:已就 2020 年 Rivian 技术盗窃诉讼案达成“有条件”和解
IT 之家 11 月 23 日消息,特斯拉表示,该公司已就 2020 年指控 Rivian Automotive 公司挖角员工窃取电动汽车商业机密的诉讼达成“有条件”和解。 特斯拉没有透露相关协议的具体细节,但告诉法官“它预计将在圆满完成条款后寻求在 12 月 24 日之前撤回此案”。 截至 IT
微软 Surface Laptop 5 和 6 固件 1.0 更新,修复显示和音频问题
IT 之家 11 月 23 日消息,微软于 11 月 19 日发布了 Surface Laptop 5 和 Surface Laptop 6 的新固件更新,版本号为 1.0。 此更新提供了安全修补程序、针对显示闪烁、音频问题以及某些应用(如 Citrix Workspace)问题的修复程序。 IT
亚马逊将向OpenAI最大的竞争对手Anthropic再投资40亿美元
亚马逊周五宣布,将向人工智能初创公司 Anthropic 再投资 40 亿美元。Anthropic 是由前 OpenAI 研究高管创立的。 Anthropic 表示,这笔新资金使总投资达到 80 亿美元,不过亚马逊仍将保持其小股东的地位。 Anthropic 是 Claude 背后的公司,Claud
马斯克新头衔「马园长」筹备已久的得州幼儿园终于迎来开张
马斯克在美国得克萨斯州筹备的「学前班」学校即将迎来开学。该校名为「Ad Astra」,在拉丁语中意味飞向星空,以致敬马斯克的星际梦想。据该校称,周四其已经获得了得克萨斯州儿童保育监管机构的初步许可,即将开始其雄心勃勃的征程。 此前,一份文件披露,马斯克计划在得州奥斯汀不远处建立一所以 STEM(理科
紫光推出国产芯KX-7000台式机 支持银河麒麟、统信UOS等国产系统
近期,紫光计算机基于兆芯开先 KX-7000 系列处理器平台正式推出了 UNIS D3890 G2s 台式机产品,采用开先 KX-7000 处理器,支持银河麒麟、统信 UOS 等国产操作系统。兆芯开先 KX-7000 处理器兼容 x86 架构指令集,具备 8 核心 8 线程、4MB 二级缓存、32M
鸿蒙智行尊界首车官宣命名 S800,11 月 26 日华为 Mate 70 发布会亮相
11 月 22 日消息,鸿蒙智行尊界品牌首款豪华轿车外观将于 11 月 26 日华为 Mate 70 系列手机发布会公开亮相。鸿蒙智行今日官宣,尊界首款车型命名为「尊界 S800」。 海报中透露了尊界 S800 的部分灯光外观,采用亮眼的点状红色星条设计。 据 IT 之家此前报道,华为常务董事、终端
北汽享界汽车法务部正式起诉自媒体「袁启聪」
11 月 22 日消息,享界汽车法务部官博今日发布首条微博,宣布正式起诉自媒体「袁启聪」,附公告内容如下: 正式起诉自媒体「袁启聪」 自媒体「袁启聪」及其相关矩阵账号在「新浪微博」「今日头条」「哔哩哔哩」等平台发布涉享界 S9 不客观、不严谨的测试结论,严重误导了消费者,损害了北汽享界汽车品牌的声誉
比亚迪否认收购蔚来汽车:严重不实,请大家不信谣不传谣
11 月 22 日消息,针对网传「比亚迪收购蔚来汽车」消息,比亚迪集团品牌及公关处总经理李云飞今日在微博回应称: 网传的比亚迪与蔚来汽车相关的投资及合作信息,为严重不实信息!请大家不信谣,不传谣。 此外,蔚来汽车品牌与传播助理副总裁马麟在微博辟谣称: 公司近况挺好,三季度现金流转正,10 月毛利进一