阿里巴巴AI Lab成立两年,都做了些什么?
https://mp.weixin.qq.com/s/trkCGvpW6aCgnFwLxrGmvQ
撰稿 & 整理|Debra 编辑|Debra
导读:在 2018 云栖人工智能峰会上,阿里巴巴推出的人工智能产品和相关服务真不少,包括一款天猫精灵人机交流车载系统,两款搭载天猫精灵系统的移动机器人太空蛋、太空梭,汽车战略重大升级,推出车路协同系统以及首款 L4 车辆协同自动驾驶新能源车。AI 前线对这些产品介绍做了整理,希望可以帮助大家了解阿里这段时间在智能语音、自动驾驶方面的最新研究和进展。
天猫精灵人机交流车载系统
阿里巴巴自从 2017 年 7 月推出天猫精灵品牌之后,已经陆续推出了多款 AI 智能产品,其中大家最熟悉的可能是智能音箱天猫精灵。据达摩院人工智能实验室产品总负责人杜海涛介绍,目前,智能音箱天猫精灵销量已破 500W 台,具备 700 多项能力,连接了近 7000 万可用家庭电器,每天调用峰值达 4000 万次,每天陪伴在人身边的时长达 1 小时。数据显示,2018 年第一季度,天猫精灵已经以 110 万的出货量占据了中国智能音箱市场 59% 的市场份额,并做到了中国第一、全球第三的位置,成为阿里人工智能落地产品中的代表,引人注目。
在今天的人工智能峰会上,天猫精灵的另一项新发布,同样吸引人的眼球,那就是天猫精灵人机交流车载系统。据介绍,它包括在阿里的天猫精灵汽车 AI+计划之内。
据介绍,这个系统主要围绕导航、娱乐、通讯需求而开发,采用了阵列增强技术,在车内拥有 10dB 以上的干扰消除能力,语音唤醒日常环境下准确率达到 95%,语音识别率达到了 93%;搭载声纹识别技术,全球首用智能语音支付场景,其语音合成技术可以贴合人声自然度 90% 以上。
天猫精灵人机交流车载系统具有车内人机交互、人车互动、娱乐服务和家车互联四项主要功能。其中声纹技术迁移到车载系统,在人机交互中可以发挥抗噪的功能;人车交互包括语音调用查询车辆状态等功能;娱乐服务包括听新闻、音乐和电台,也可查询天气、股票订餐和票务等信息;家车互联旨在将家和车辆信息打通。官方称,阿里的家车互联已经支持 164 个智能平台,并且联合了 300 多个品牌,支持 1000 多款设备。
早在今年 6 月,阿里巴巴天猫精灵就已经与沃尔沃、宝马、奔驰、奥迪四家车企达成合作,具有联网功能的车辆均可以在未来搭载天猫精灵人机交流车载系统。阿里透露,明年将与沃尔沃全线车辆达成合作,落地内置天猫精灵。
阿里将开未来酒店,用上天猫精灵太空蛋
在峰会上,天猫精灵发布了新系统:Aligenie 3.0。它具备听、说、看、行动的能力,可以实现精准定位、自助导航、环境感知、传感器融合、人机交互、多机器人协同,实现语音、视觉、多模态交互功能。
此外,天猫精灵家族再添两名新成员:太空蛋和太空梭,将分别用于未来酒店和医院等设施。天猫精灵太空蛋可以接收天猫精灵的指令,乘坐自动电梯进行物品快送,也可自动去储备仓。官方表示,太空蛋将会用于第一家阿里未来酒店。
另外一款机器人太空梭将会用于医院等设施,它内置了 60 个独立药仓,可用语音控制进行非接触式无菌操作,乘坐自动电梯进行物品快送。这两款产品都内嵌了 Aligenie 3.0 系统。
首创智能感知基站,车路协同系统
峰会上,阿里巴巴集团宣布升级汽车战略:由车向路延展,利用车路协同技术打造全新的“智能高速公路”。这一战略将由 AliOS 联合阿里云、达摩院、高德、支付宝、千寻位置、斑马网络等共同完成,旨在探索未来二十年的路。达摩院人工智能实验室首席科学家王刚对车路协同系统做了详细介绍。
他指出,自动驾驶其实早已不是一个新的研究课题,但是为什么经过长时间研究到现在也没有完全实现自动驾驶和商业化呢?开发人员也许应该反思他们的技术路径和方法是否可以优化。
在他看来,其中一个原因就在于过去几十年自动驾驶领域专注于单车智能优化,但单车智能系统即使智能程度达到非常高的水平,也会面临很多问题,如感知盲区、死角、障碍物会导致真实环境中的安全隐患;车载传感器不购灵敏,即使是最好的激光雷达能感知到的行人距离仅有几十米,而且系统极度依赖高精度地图,一旦发生特殊情况,系统处理就会出问题。这是单车智能系统面临的非常困难或者根本不可能克服的难题;单车智能系统的另一个问题是成本,据统计,2018 年自动驾驶车辆均价为 20 万美元,高昂的成本阻碍了自动驾驶技术的发展。
所以,阿里认为打造安全可靠、成本降低的自动驾驶车辆,需要将车辆自身和道路设施结合起来,利用“聪明”的道路和道路设施来解决问题,道路数据协同共享还可以降低成本。基于此,阿里推出了车路协同系统。协同智能系统能够提高安全性能,在“看”、“想”、“做”(分别对应着自动驾驶车辆感知、决策、控制三个部分)三个方面提高安全性能、降低成本。王刚重点介绍了车路协同系统在感知上的功能,他表示,车路协同智能系统中的感知基站,可以做到无死角、精准识别路面状况、互联互通车辆、全覆盖感知,而没有感知距离的限制;在决策上,相对单车智能的局部最优,协同智能可以做到全局最优。
目前,阿里已经和交通运输部公路研究院成立了车路协同的实验室,未来会将技术开放给产业。
首款 L4 车路协同自动驾驶新能源车
峰会上,阿里还发布了首款 L4 新能源车,搭载了协同智能系统,能够实现“车端 - 路端 - 云端”三位一体的车路协同智能。
据介绍,阿里发布的自动驾驶智慧物流车前后和两侧使用 Velodyne 的 16 线激光雷达,车顶安装一个 Velodyne 32 线激光雷达,一个双目摄像头,5 个单目摄像头,其他的传感器,如 RTK、超声波雷达等则隐藏在车身中。
该车在城市道路中的行驶速度在 30 到 40 公里左右,载重在几吨的级别,定位精度在 20 厘米以内。
阿里巴巴人工智能实验室表示,这款定位于 L4 级别的自动驾驶智慧物流车从去年开始研发,目前仍处于测试阶段,离量产还需要一些时间。
除此之外,阿里巴巴还喜提杭州市第一张自动驾驶路测牌照,王刚代表阿里“无人车”团队,接过了这张车牌号为“浙 A4390 测”的牌照。据悉,这是继此前阿里曝光无人车、车路协同技术方案后,在自动驾驶方面的最新进展。
不只消费级产品,阿里AI Lab走向何方?
2017 年,阿里巴巴将马云投入上亿美元的 Pepper 机器人项目中止,把人员队伍拆分划进人工智能实验室(阿里 AI Labs)。自此,主导智能音箱项目的阿里巴巴人工智能实验室潜伏地下,默默攻关有半年之久,致力于打造“阿里巴巴人工智能实验室首款消费级人工智能产品”。
2017 年 8 月,阿里人工智能实验室推出了天猫精灵 X1 智能音箱和智能语音系统 AliGenie,正式入局智能音箱市场。
2018 年 3 月 22 日,阿里巴巴人工智能实验室在北京召开新品发布会上公布了几项新产品:新版交互引擎 AliGenie 2.0:在第一代中文语音交互的基础上,引入了「听觉」、「视觉」、「触觉」及「情感反馈」的多模态交互能力;「精灵火眼」+ XHolder:天猫精灵手机 APP 中新增「精灵火眼」功能,搭配连接硬件 XHolder,便可将智能手机秒变音箱显示屏幕,同时为天猫精灵增加视觉能力;天猫精灵曲奇版:一款 Mini 智能音箱,同样搭载 AliGenie 语音系统,可用于播放音乐、电台,也可购物、控制能家居,售价为 299 元;天猫魔屏:一款 3D 智能投影仪,覆盖华数、优酷、土豆等多个内容平台,可支持天猫精灵语音操控。
截至当时,天猫精灵的总销量已经突破 200 万台,累计回答了超过 1 亿个问题,执行了 9 亿次任务。此外,天猫精灵在智能家居生态上也进一步扩容,目前可连接 4500 万台家用电器,并联合联发科发布了蓝牙 Mesh 5.0 协议。
直到 2017 年 10 月,长于自然语言理解、实体挖掘的聂再清担任 AI Labs 北京研发中心总负责人,擅长计算机视觉的李名杨任 AI Labs 机器视觉杰出科学家。两位专家的加入,预示着 AI Labs 未来的产品方向除了天猫精灵这一语音交互产品外,很可能会推出基于视觉交互,甚至“机器人”类型的人工智能产品,重新恢复对机器人的研发。
果不其然,在云栖大会上,AI Labs 发布了两款面向 B 端企业用户的服务型机器人,一款室内送货机器人、一款室内补货机器人,其操作流程与天猫精灵语音系统全面打通,而支付环节则打通了支付宝。而这与去年 7 月该实验室发布智能音箱时给自己设立的「专注于消费级 AI 产品」的定位,实际上已经有所偏差。
在团队组成上,阿里人工智能实验室过去一年里也发生了一些变化。
其中,浅雪(本名陈丽娟)已由 2017 年发布天猫精灵 X1 智能音箱和智能语音系统 AliGenie 时的智能生活事业部总经理,变为人工智能实验室负责人。杜海涛也由原来的高级产品专家升为人工智能实验室产品总负责人。而王刚则带领无人驾驶研发团队独立出来,组建了达摩院智慧交通实验室。
从今天阿里在峰会上公布的几项重大发布中,我们不难发现阿里对于“车”的重视,从天猫精灵人机交流车载系统、车路智能协同系统、首款搭载车路智能协同系统 L4 新能源汽车,到智慧物流车,无一不体现着阿里对自动驾驶的野心。另一方面,阿里人工智能实验室的定位,也由原来的专注于“消费级 AI 产品”,开始向机器人、智能货运等方向拓展。
未来,它将在这几个方向如何发力?如何在 AI 实验室遍地开花的时代下脱颖而出?我们拭目以待。