云计算-字节-自动驾驶-汽车漫谈
云计算-字节-自动驾驶-汽车漫谈
边缘云市场份额,百度智能云领先!
近日,IDC 发布《中国边缘云市场解读,2022》。报告显示,2021年中国边缘公有云服务市场份额,百度智能云以13.8%的市场份额位列中国边缘云市场份额Top 2。
早在2019年,百度智能云作为业界首家边缘云服务商就开始在边缘云布局,现已经形成云-边-端三位一体完善的产品矩阵。
云 - CDN边缘(BEC)
基于百度1000+ CDN 节点打造,完成国内七大区、三网覆盖。提供完善的边缘云基础设施能力。
边 - 移动边缘(IME)
基于5G基站或园区机房构建,提供延迟10ms内的算力,支撑车路协同和远程医疗等场景。
端 - 端边缘(ECS)
包含适应边缘极端环境的硬件及管理平台,结合场景化AI算法提供软硬一体的解决方案,帮助客户处理复杂现场环境的应用需求。
百度智能云边缘云已在互联网视频、智慧交通、智慧园区等场景实现规模化落地。
在互联网视频领域
国内多头部视频厂商将转码、渲染、合流等模块下沉BEC处理,实现了视频流的就近接入、处理、分发,能够为终端用户提供清晰、流畅的视频观看体验。
在智慧交通领域
国内某头部汽车厂商基于BEC的边缘算力建设车-边-云一张网能力,实现了车机数据实时上报和指令实时下发,同时完成多节点数据同步,并将核心数据从内网安全传输到中心云进行数据存储和分析。保证车辆数据本地传输安全、稳定、合规,提升人车实时交互体验。
在智慧园区领域
国内某开发商利用ECS边缘盒子分区域部署多个AI算法,从而提高园区安全性、降低人力成本、提高管理效率。
IDC在报告中预判:“在算力体系中,边缘的地位和意义正在不断提升,甚至成为新算力模型、概念、产品矩阵/服务体系中的必备一环”。
在未来,百度智能云边缘云与中心云将进一步对齐,技术上实现同源同栈、产品上实现功能和体验一致。并将持续建设边缘PaaS产品能力,包括边缘数据库、Serverless、大数据等服务。
此外,百度智能云将进一步打通边缘云服务和中心云服务,为客户提供功能全面、敏捷部署上线、资源无处不在、统一管理和调度的分布式云基础设施。
百度智能云将会持续在边缘云扩大投入,增加全球节点布局,为客户提供全球广域覆盖的边缘节点,提供多元智能的边缘算力,支撑新兴场景落地,加速产业智能化升级。
字节真的亏了849亿?
去年6月,字节在“CEO面对面”员工会上首次披露公司财务数据:2020年营收达2366亿元人民币,同比增长111%;经营亏损147亿元,同比大降400%。
在今年8月发给员工的另一份文件中,字节披露2021年营收达617亿美元(约合4391亿元人民币),同比增速降至86%。
同一报告期内,字节各项成本费用快速膨胀,其中销售成本增长79%,研发、营销等分项费用也高达上百亿美元。由于成本与营收增速基本持平,再叠加费用增长,字节2021年经营亏损高达71.5亿美元(约合509亿元人民币),同比扩大近2.5倍。
进入2022年,得益于各项成本控制措施,字节盈利状况明显改善。今年第一季度,字节营收同比增速进一步收缩至54%,但经营利润扭亏为盈,带动净亏损收窄近84%。
那么,字节跳动 2021 年实现收入 617 亿美元,同比增长 80%。净亏损也达到惊人的 849 亿美元。
但实际上字节跳动没有真的亏那么多钱。巨额亏损主要受可转债公允价值变动影响(756 亿美元)。这些钱的变动只存在于账面,体现字节估值而不是盈利能力的变化,并不会让字节跳动损失一块钱现金。
假设投资者在字节估值 100 亿美元的时候买入,等字节估值 500 亿美元时,投资者账面赚 400 亿美元,字节则要记一笔 400 亿美元 “亏损”,会在上市后抵消。理论上字节 IPO 前的估值增长越多,账面亏损也越多。美团、快手等互联网公司招股书都因为类似原因记账成百上千亿元净亏损。
去年,字节跳动主营业成本约为 274 亿美元,同比增长 79%。收入减去成本得到 343 亿美元毛利润、对应 55.5% 的毛利率。作为参考,腾讯 2021 年毛利率约为 43.91%。按去年年底汇率换算,字节跳动总收入约等于美团、百度、拼多多收入之和。
扣掉 146 亿美元研发费用、192 亿美元市场营销费用和其他开支以后,字节跳动 2021 年经营亏损 71.5 亿美元、是 2020 年的 3.34 倍。年末,字节跳动现金储备约为 341 亿美元。
今年一季度,字节营收同比增长近 54%、达到约 183 亿美元,且实现经营利润。
字节跳动未对上述数据置评。
联创智驾 为爱驰行
金秋10月,爱驰旗下第二款纯电动智能轿跑SUV爱驰U6,在万众期待中迎来正式上市。作为助推爱驰品牌向上的诚意之作,爱驰U6凭借潮酷设计、智能科技及优秀品质迅速获得了海内外“驰迷”的拥趸。爱驰U6在传承经典设计,演绎新生代审美趋势的同时,深刻洞察当下汽车行业“新四化”变迁所带来的消费新需求,以创新智能科技赋能智能驾驶,完美诠释了未来智能出行新潮流。联创汽车电子携ADAS系统全力助力爱驰U6引领未来智能出行新潮流!
AI巡航驾驶辅助系统
赋能爱驰U6,开启智能出行新潮流
爱驰U6搭载了AI-Cruise智能驾驶辅助系统,实现22项驾驶辅助功能。其中,联创汽车电子AI巡航驾驶辅助系统成功应用于爱驰U6,以过硬的创新科技赋能U6实现SCC超级巡航、LKA车道居中保持、DCLC转向灯变道辅助、FCW&AEB前方碰撞预警和自动紧急刹车等高级驾驶辅助功能,为天生玩家用户带来了全新的智能出行驾乘体验。
配置灵活、安全可靠、极致体验
联创汽车电子自主研发的智能辅助驾驶系统,可为用户提供Entry、Standard、Premium三类不同配置,产品覆盖L1-L4+全应用场景,客户可根据自身车型配置及电器架构,选择打包解决方案或单一产品。在产品的迭代升级中,联创汽车电子的智能驾驶辅助系统也逐步形成了极具市场竞争优势的产品特点:
满足功能安全等级ASIL B-D,以及NCAP五星要求(CNCAP/ENCAP),具备业内领先的算法性能;
覆盖超级巡航SCC、车道居中保持LKA、转向灯变道辅助DCLC、前方碰撞预警和自动紧急刹车FCW&AEB等ADAS全功能。
联创智驾在ADAS产品完善与成熟的同时,也在布局和规划着未来。通过广纳贤才、成立攻坚小组、加强同行技术交流等举措,推动全环境融合和DNP等功能的自主开发,分阶段实现自动驾驶功能从L1-L2级别向L3-L4级别的迭代研发,满足客户及消费者需求。
近年随着ADAS渗透率的迅速提升,各大车厂、供应商、互联网等企业纷纷下场,希望在国内格局未定的市场中角逐胜出。联创汽车电子智驾团队凭借本土化、高性价比、底盘操控协同、服务响应及时等优势,经过与爱驰及国内多家主流主机厂的合作开发,脚踏实地稳步成长,极致打磨差异化用户体验,具备了与全球一流供应商同场竞技一比高下的能力。相信爱驰U6的成功发布,将进一步推动联创智驾系统产品研发与量产应用能力迭代,助力客户提升智能驾驶体验,共同打造未来智能出行生活。
联创汽车电子
联创汽车电子是一家专注于汽车智能网联控制器开发的高科技创新企业,公司聚焦智能底盘及智能驾驶域控制器相关业务领域,自主创新,不断突破“卡脖子”技术,研发并量产智能转向控制系统、智能制动控制系统,和覆盖L1-L4+全应用场景的智能驾驶辅助系统,以及5G+V2X数字网联产品等智能网联汽车关键核心零部件,以扎实的自主研发技术实力和丰富的量产应用经验,为客户提供优质的产品和服务,赋能智能网联汽车的发展。
爱驰汽车是一家国际化的智能新能源汽车公司,也是一家用户深度参与的智能出行服务公司,致力于以全球化智能科技,持续改善用户的出行体验,实力成就中国新能源汽车全球化先行者。爱驰汽车自成立之初,就秉承国际化、智能化两大基因,确立国际化发展路径,坚持国内、国际两个市场同步推进;同时,在制造、研发、产品、市场、服务等全产业链兼顾中外标准和需求,推动高质量双循环发展。目前,爱驰已实现横跨欧亚的全球化布局。
大众汽车集团强化在华自动驾驶领域研发实力,旗下软件公司CARIAD携手地平线成立合资公司
地平线要闻:
(2022年10月13日,沃尔夫斯堡/北京)大众汽车集团持续加强“在中国,为中国”的研发能力,加快创新节奏,促进技术本土化,并进一步聚焦中国消费者需求。集团旗下软件公司CARIAD,与高效能智能驾驶计算平台领导者地平线开展的全新合作,将加快集团面向中国市场的高级驾驶辅助系统和自动驾驶系统开发进程。CARIAD将与地平线成立合资企业并控股。大众汽车集团计划为本次合作投资约24亿欧元,该交易预计在2023年上半年完成。针对中国市场需求,CARIAD将携手地平线开发领先的、高度优化的全栈式高级驾驶辅助系统和自动驾驶解决方案,在单颗芯片上集成多种功能,提高系统稳定性,节约成本,降低能耗。这一“软硬结合”的技术有利于打造差异化创新,为集团在中国的纯电动车型提供可扩展的、高性价比的高级驾驶辅助系统和自动驾驶解决方案。本投资交易尚待合作各方最终签署协议并获得相关政府机构审批。
大众汽车集团(中国)董事长兼首席执行官贝瑞德表示:
“中国市场充满活力,是集团在全球最重要的业务区域。与地平线的合作是集团在华推进战略转型,强化在华业务的核心基石。本土研发将赋予我们更多的自主权,进一步巩固我们在中国汽车市场中的领先位置。未来组建的合资企业将开发包括完整软硬件堆栈技术在内的前沿技术,使我们能够以更快的速度、持续为中国消费者提供定制化产品和服务。通过与地平线的合作,我们将加速在自动驾驶领域的发展,推进NEW AUTO战略,进一步驱动中国业务转型。”
CARIAD首席执行官Dirk Hilgenberg表示:
“作为大众汽车集团的全球汽车软件和技术创新中心,CARIAD是助力集团转型为软件驱动型移动出行服务商的重要力量。通过与地平线成立合资公司,以及对自动驾驶技术的进一步投入,我们将在中国汽车市场新一轮创新和现代化浪潮中,进一步确立集团的地位。我们的目标是为集团和股东在中国创造符合市场增长预期的长期价值。”
地平线创始人兼首席执行官余凯表示:
“地平线的使命是赋能机器,让人类生活更安全,更美好。自成立以来,我们就致力于让每一辆车都搭载地平线智能计算平台。作为推动智能驾驶在中国乘用车领域商业化应用的先行者之一,我们通过同大众汽车集团旗下软件公司CARIAD的合作,将充分发挥地平线的优势,为中国智能汽车用户开发新一代技术和解决方案。我们相信凭借领先的软硬结合解决方案,地平线将成为国际车企在中国的首选合作伙伴。”
由先进的高级驾驶辅助系统和自动驾驶系统赋能的智能驾驶,是未来移动出行的关键技术,其市场增长潜力巨大。因此,智能驾驶相关技术的开发速度对移动出行行业的智能化转型至关重要。CARIAD与地平线成立合资企业,并在其中持有60%的股份。双方致力于加速自动驾驶软硬件技术在中国汽车市场的开发和商业化,为中国消费者尽早带来自动驾驶汽车的驾乘体验。
关于大众汽车集团
大众汽车集团成立于1938年,总部位于德国沃尔夫斯堡,是欧洲最大的汽车公司,也是世界汽车行业中最具实力的跨国公司之一。集团旗下拥有来自欧洲7个国家的12个品牌:大众汽车乘用车品牌(德国)、奥迪(德国)、兰博基尼(意大利)、宾利(英国)、布加迪(法国)、西雅特(西班牙)、斯柯达(捷克)、大众汽车商用车(德国)、斯堪尼亚(瑞典)、MAN(德国)、保时捷(德国)、杜卡迪(意大利)。大众汽车集团产品销往153个国家和地区,业务领域包括汽车的研发、生产、销售、物流、服务、汽车零部件、金融服务、汽车保险、银行等。
截至2021年12月,大众汽车集团全球共有120家工厂,拥有员工67.28万人。2021年,大众汽车集团共交付汽车约888.2万辆。
大众汽车集团在中国
大众汽车集团是中国汽车工业最大、最早也是最成功的国际合作伙伴。早在1978年,大众汽车集团即开始了与中国的联系。多年来,大众汽车集团在中国市场中始终处于领先的地位。1984年,集团在华的第一家合资企业——上汽大众汽车有限公司奠基成立。1991年,集团在华的第二家合资企业——位于长春的一汽-大众汽车有限公司成立。2017年,集团在华的第三家合资企业—江淮大众汽车有限公司成立,专注于新能源汽车的研发和制造。2020年底,大众汽车集团增持江淮大众股份至75%,并将其正式更名为大众汽车(安徽)有限公司。大众汽车集团在华经营范围包括汽车整车、零部件、发动机以及变速箱的生产、销售与服务等。连同进口车,大众汽车乘用车品牌、奥迪、斯柯达、保时捷、宾利、兰博基尼、大众汽车商用车、曼恩、斯堪尼亚和杜卡迪等品牌都已在中国开展业务。2021年,大众汽车集团(中国)携手合资企业全年共交付汽车330万辆。截至2021年底,大众汽车集团(中国)拥有员工超过9万人。
关于CARIAD SE
CARIAD是大众汽车集团旗下的汽车软件公司,致力于巩固和进一步扩大集团的软件实力,以重塑移动出行。公司正在为汽车行业开发领先的技术栈,其使命是用创新的解决方案,为所有人、在全球提供更安全、可持续且舒适的出行体验。前身为2020年建立的大众汽车软件事业部——Car.Software Organisation,目前CARIAD全球约5000名工程师和开发人员,主要任务是为集团旗下所有品牌构建一个统一的软件平台,包括一个统一的、可扩展的架构,支撑大众自主研发的操作系统VW.OS,并连接至大众汽车云VW.AC。新的软件平台将在2025年左右首次发布。此外,CARIAD正在开发车辆的数字功能,包括 ADAS(高级驾驶辅助系统)、标准化信息娱乐系统、用于连接动力系统的软件功能、底盘和充电技术以及汽车新生态系统以及新的数字商业模式。公司已经在德国沃尔夫斯堡、因戈尔施塔特、斯图加特地区、柏林、慕尼黑等城市建立了研发中心,还与大众汽车集团在美国和中国的国际研发团队建立了紧密的合作关系。
2022年4月,CARIAD发布中国战略并成立CARIAD中国子公司。作为CARIAD在欧洲之外的第一家子公司,本着“在中国研发,为中国创新;在中国研发,为世界创新”的使命,中国团队将基于本土消费者需求和客户体验,为中国市场提供创新的移动出行解决方案。CARIAD中国子公司目前已拥有超过800名员工。除北京总部外,CARIAD中国子公司已在合肥和上海设立了分公司,并计划在成都和杭州进一步组建研发力量,逐步构建覆盖全国的分布式研发网络。
关于地平线
以“赋能机器,让人类生活更安全,更美好”为使命,地平线是行业领先的高效能智能驾驶计算方案提供商。作为推动智能驾驶在中国乘用车领域商业化应用的先行者,地平线致力于通过软硬结合的前瞻性技术理念,研发极致效能的硬件计算平台以及开放易用的软件开发工具,为智能汽车产业变革提供核心技术基础设施和开放繁荣的软件开发生态,为用户带来无与伦比的智能驾驶体验。
城区导航智能驾驶难在哪?写在小鹏/华为-极狐NOA释放之时
一、什么是城区导航智能驾驶
图1 2021年上海车展,华为-极狐城区导航智能驾驶首秀
在一段极端复杂路况下连贯,灵活的动作火爆全网。图片来自《42号车库》过往的作品。
本文要讨论的城区导航智能驾驶,指的是在HD-MAP(高精地图)或类似功能ADS地图加持下的,可以实现特定城区范围内的(一般是高精地图范围内或者版本发布Geo Fence(地理围栏)内的)点到点智能辅助驾驶。
近来,也有不少公司开始尝试在城市导航智能驾驶方案中摆脱对高精地图的依赖,即所谓“重感知、轻地图”路线。
与一般意义上的tesla的AutoPilot(类似的还有小鹏的LCC,华为-极狐的ICA)这种不带点到点导航、路口不会拐弯不能处理红绿灯,一条道走到黑的简单车道保持+跟车的功能相比,城区导航智能驾驶需要人类驾驶员接管介入的概率更低,整体体验更连贯、更灵活,更符合普通消费者对于“自动驾驶”的认知(见图1)。
高精地图/ADAS地图可以提供海量丰富的各类图层与各种信息,在一般消费者可感知的角度,相比于简单的车道保持+跟车功能,城区导航辅助驾驶最大变化主要是以下4个方面:
为了描述方便,以下统一用ego代指配备了城区导航智能驾驶特性的"自车"。
序号 |
实现功能 |
对应的高精地图信息 |
备注 |
1 |
路口红绿灯处理:即红灯停,绿灯行 |
Traffic_light lane Association:即交通灯与对应车道的控制绑定信息(见下图2) |
可以简单地理解成某个特定的红绿灯对应控制哪几个车道 |
2 |
路口时自动转弯,直行时导航换道 |
道路拓扑与导航信息 |
导航换道:比如根据导航信息,下个路口要右拐,那么ego会提前换道到最右侧车道 |
3 |
道路限速行驶 |
道路限速信息 |
严格来说,这个功能可以在SDmap,或者利用实时感知限速牌信息实现。不过目前,由于各种原因,各家均未直接使用SDmap的限速信息或者视觉感知限速信息直接控车。 |
4 |
其他超视距信息的精细化处理与丰富的定位图层带来的定位性能优化。 |
N/A |
比如:潮汐车道处理,公交车道处理,公交港湾避让,Merge Aviod,人行道处理,各类盲区处理等,与高精地图丰富的定位信息下带来的车辆定位性能优化(纵向,多层道路,城区高楼RTK遮挡等)。 |
图2 Traffic_light lane Association
图3 HD—MAP中海量的各种信息
针对这种功能,各家实现的技术路径大同小异:感知(包括目标检测/跟踪/多传感器融合),预测采用14年后爆火的深度学习技术栈,定位/规控/HDMAP则在以前机器人学的技术栈上通过不断演化。各家目前量产的名称略有不同:小鹏叫NGP(城区),华为-极狐叫NCA(城区),蔚来叫NOP(城区),长城叫NOH。
N:即Navigation:导航,对于城区智能驾驶场景经常被宣传为“ 点到点”
下面为了讨论方便,统一名称为城区导航智能驾驶。事实上,这个功能各家已经“跳票”好久,小鹏之前承诺今年初释放城区NGP,华为-极狐承诺去年底释放城区NCA,都已经跳票半年到一年不等,而蔚来的NOP(城区)则到今天都还没有踪影,实际上我个人认为今年底之前蔚来都不会释放城区NOP。
可见,如果说对现阶段自动驾驶技术实现难度排序的话,那么城区导航智能驾驶技术是绝对的,当之无愧的“珠穆朗玛峰”。
二、为什么等了这么久之后,小鹏与华为-极狐又几乎同时释放了?
近期国内开放了部分城市的城区高精地图作为试点,于是小鹏和华为-极狐开始了首发城区导航智能驾驶大战:9月17日,小鹏率先在其公众号的宣称自己已经开始向部分P5用户推送广州部分路段首发城区导航智能驾驶功能(NGP),并邀请大量媒体试乘试驾造势;结果9月23日,华为-极狐公众号官宣,已经向深圳部分用户推送全量深圳城区导航智能驾驶功能,“截胡"了全球首发城区高阶导航智能驾驶称号。
图4 小鹏与华为-极狐争夺城区导航智能驾驶首发排名
不过其实我猜两家的策略应该是一致的,都不敢同时放开大量普通消费者使用,均是先采用极其极其极其极其个别的友好用户(猜测每家普通消费者数目得到体验入场券的人不会超过小几十个人,基本上选中了就可以回家买彩票了)优先体验的方式打开城区导航智能驾驶。
而蔚来,理想,甚至是刚刚开过AI DAY的着重笔墨讲城区智能驾驶的毫末智行,均未见量产产品踪影。
三、为什么各家对于释放城区导航智能驾驶都这么谨慎?
因为城区导航智能驾驶实在太难了。
首先说一个结论,如果把人类司机驾驶员的平均水平作为Ground Truth来比对,目前各家的城区导航智能驾驶在安全性、体验、效率均需要继续打磨。
城区导航智能驾驶是corner case的集散地,是长尾挑战的史前巨坑。一般情况下,Robotaxi公司由于其成本压力低,其Sensor Set的配置几乎是最豪华的;其造型外观要求也没有量产车那么高,其Sensor Layout也是最优的(标志性的花盆顶激光造型),在这种情况下,其城区场景下的MPI水平一般都在几十左右。
图5 RoboTaxi公司典型的传感器布局
这里请有些同学收起来加州DMV的统计报告,那份报告中的MPI数据与其说是通过MPI比较各家公司的技术水平,不如说是通过MPI比较各家公司的道德水准。不过excel里面有些公司的disengage原因还是值得一看的,写的很真诚。
国内最高算法水平、最佳sensor Layout的公司,在国内每天平均通勤距离(有统计一线城市的平均通勤距离大概在每天30km左右)下使用时,平均下来一天有1次紧急接管的可能性。
要知道,对于量产车而言,坐在驾驶位上的是普通消费者,而不是“久经考验”的智能驾驶公司的Test-Driver们,其对于系统表现的预见性与车辆操控的熟练度远远比不上被自家系统天天“训练”的Test Driver们。所以各家在释放城区导航驾驶上非常谨慎,也就可以理解了。
这也就意味着,如果有100辆车开启了城区智能驾驶,每天的潜在可能的紧急接管数目在100次左右,如果有1000辆车,那么潜在的接管次数就是1000次左右。这个数据下,指望普通消费者像被自家系统天天“训练”的Test Driver们一样,在出现紧急情况下都能救回来显然是不现实的。
不过也不用过于悲观,Tesla
FSD在闹市区的MPI是个位数,有兴趣的同学可以没事了去油管一个一个视频数数......注意油管上很多Tesla的测试路况其实比国内城区路况差得远,数的时候要大概挑一挑^_^
四、城区导航智能驾驶到底难在哪?
下面以为由易到难的排序,去描述城区导航智能驾驶的难题。
4-1 HD—MAP
高精地图其实本质上已经不是一个技术难题,而是一个成本难题。一般同学可以把高精地图当成一个异次元世界,ego从某种程度上来说,是在这个异次元世界中行驶,再把ego“看见”的其他目标(人、车、骑行人、红绿灯结果)投射到或者匹配到这个异次元世界中,从而“理解”这个异次元世界,最后达到看起来像是在现实世界中行驶的目的。
事实上,这个原理跟家里的扫地机器人没有太本质的区别。现阶段的自动驾驶就是人工智能(特别是计算机视觉)与机器人学的集大成者。
图5 ego把现实世界中感知到的目标信息投射/匹配到高精地图中,“理解”并在异次元世界中行驶。
这样会带来两个问题:
4-1-1 这个异次元世界的表达与真实物理世界的贴合程度直接决定了城区导航智能驾驶的水平
即HD—MAP的制作工艺质量、反应现实世界元素的丰富程度、拟合现实世界人类开车习惯的准确程度直接决定了城区导航智能驾驶的水平。
以这个异次元世界中道路元素表达和真实物理世界中人类开车习惯的匹配程度举例:高精地图中ego所行驶的车道叫做lane,你可以把他理解成火车的轨道。ego在绝大多数情况下会沿着这条reference lane行驶,极其个别情况下,会做一些“看上去类人”的比如避障一类的操作。
地图中的reference lane (特别是路口,merge等道路拓扑复杂的场景下 )的制作水平直接决定了ego的行驶合理性甚至是安全性。且各家的制作水平不一,在lane内(或者更大策略空间)策略空间的优化水平参差不齐,这种“看上去类人”的动作很多时候是“看上去智障”的操作甚至是“看上去危险”的操作。以至于在各家智能驾驶经常测试的路段,只要稍微用心观察就可以轻松分辨出车辆是否处于智能驾驶状态。
图6 在HD—MAP的Reference Lane中行驶的Ego
从这个角度看,与其说城区导航智能驾驶是智能驾驶小汽车,还不如说是“智能驾驶”小火车——沿着既定的Hdmap给出的“轨道”行驶。“轨道”铺到哪里,“小火车”就开到哪里,“轨道”修得不好,“小火车”就开得不好。
图7 “智能驾驶小火车”的轨道
与此类似的,还有hd—map中是否包含红绿灯倒数灯信息,在无红绿灯路口拓扑的处理方式,hd—map中环岛的道路拓扑建立(实际上真实世界中,人类开车处理环岛都很复杂)等等等等......
现实世界中无穷复杂的道路场景,如何在hd—map中合理、类人地表达这些人类社会中已经潜移默化约定俗成的开车习惯是非常困难的。很多时候自动化的算法处理在很多场景下并不能尽如人意,仍然需要大量的人工介入check和精修。这会大幅度增加高精地图的制作成本。
4-1-2 真实物理世界路况的实时变化及时同步到异次元世界中非常困难
即维护高精地图“鲜度”成本极高,且现阶段城区导航智能驾驶技术不能很好处理这种情况,可能会导致严重后果。
这也是Tesla掌舵人Elon Mask频繁diss Waymo高精地图路线的关键原因。
图8 We briefly barked up the tree of high precision lane line [maps], but decided it wasn't a good idea. -- Elon Musk
整个高精地图bring up制作工具链及其复杂,国内目前完全掌握的玩家并不多。再加上国内城区道路基建与道路变化相当频繁,要维持HD—MAP的“鲜度”,随着基建与道路变化进行更新的维护成本几乎无法衡量。
要不怎么叫developing country,我没搞自动驾驶的时候从来不觉得国内的城市基建有这么频繁
极端情况下,甚至会出现A路段在修路,地图情报部门通过种种渠道主动或者被动地得知以后,开始更新A路段的作业流:派出地图采集车采集,采集数据回传,地图融合制作,更新A路段Tile,转内部测试Bugfix,最后商用发布推送DOTA到车端,一套流程走下来操作猛如虎,最后发现A路段已经修路完成“恢复原状”。。。
一方面,是各家图商就算不计成本,也很难在一定周期内(比如一周甚至是一天内)更新HD—MAP的现状,而另一方面,在城区导航智能驾驶之中,如果出现了高精地图“鲜度不足”的问题,则系统便很难应对该场景。
比如上述的A路段在修路,在原来直道的基础上修出来一条大大的弯道,那么Ego在接近这个弯道的时候,很可能会仍然沿着高精地图中的“直道”行驶,从而造成危险。
上图是某厂商的事故视频,有可能当时使用的功能并非城区导航智能驾驶。不过这个事故场景非常的Match高精地图“鲜度”不足情况下可能产生的严重后果。实际上,这个场景几乎和American Flight 965的空难场景如出一辙,下来看看有没有时间专门写下....
如何应对高精地图“鲜度”不足的问题,就成为各家城区导航智能驾驶和众多robotaxi公司共同面对的问题。而现阶段解决方式大家也都大同小异:使用实时感知到的静态道路信息作校验,当发现实时感知到的静态信息(主要是车道线、道路结构拓扑、道路硬边界比如curb、红绿灯等)与高精地图中预制的信息相差很多时,触发下游进一步处理比如提示驾驶员接管等。
比如在一些OEM的SOR/RFQ中,要求系统在发现HD—MAP“鲜度”不足时,ego可以按照实时感知的静态道路信息继续行驶而非直接退出智能驾驶系统。
然而,在很多时候这种处理是一种悖论:这种处理本质上是相信车端实时感知的置信度高于预制的hd—map数据置信度,认为前者可以校验后者甚至取代后者作为下游预测—规控模块的输入;可既然我们有一个“强于高精地图”的实时感知信息源,那还需要高精地图做什么呢?
而另外一种思路是比较promising的,就是使用实时众包构图的方式,类似Mobileye的REM,华为-极狐的Roadcode-RT,Tesla的2021年AI day也对他们类似的技术有过描述,相信小鹏也有类似的技术路线。
一个常见的误区是:Tesla没有使用HD—MAP。Tesla确实没有使用用Lidar点云生成的“HD—MAP”, 不过是自己定义了新的MAP的格式,把“喵喵“叫成了”咪咪“。这部分工作可以参考21年Tesla AI DAY与华为智驾部门天才少年秦通的工作:RoadMap: A Light-Weight Semantic Map for Visual Localization towards Autonomous Driving(内容链接:https://www.zhihu.com/zvideo/1389638431253868544)
毕竟去年华为智能驾驶部门前总裁的采访中,已经非常明确地刨析了传统HD—MAP的种种问题(当时华为叫Roadcode-HD),算是给各家讲明了踩坑的经验。目前各家的名称有区别,不过其本质都是在单车上使用slam技术,经过一定程度的融合后上传云端,最后在云端实现fleet级别的地图数据融合。不过在国内由于法律法规的限制,目前这种方式还没有大规模商用的先例(起码我没看见,如果有的话请评论区提醒下)。
4-2 Perception
( Obj_Detection,Tracking,Mutli_Sensor Fusion)
在感知上,城区存在着大量无法解决的corner case (有一些人称之为“弱势场景”?):各种类型的遮挡检出、千奇百怪的各种实体交通参与者、每个城市(甚至一个城市不同区)种类繁多的红绿灯样式、从不相同的施工场景和道路障碍物......只要存在一个漏检,就是一次By force 的 Disengagement。
图9 各种奇怪的的红绿灯,甚至还有专门的Git(见下链接)
https://github.com/Charmve/OpenCC
虽然这次发布城区的小鹏和华为-极狐的都有Lidar加持,但Lidar并不是一个完美的传感器。
其实在很多场景下(阳光直射,雨天路面积水,高反障碍物,雨天黑车,超近距离盲区,烟尘雨雾)下,Lidar的表现都一般甚至可以说是“很差”——绝大多数LIDAR典型工作频率为10Hz,考虑到误报,几乎所有厂商的算法都会滤波1~2帧,这在城区极端场景(鬼探头)下是比较致命的;且Lidar需要消耗大量算力才能发挥其对动目标、通用障碍物等的检测,在目前捉襟见肘的Soc算力情况下是个挑战。
至于多目标融合.....真正在做融合的同学应该很清楚,无论是所谓的后融合、特征级融合还是前融合,本质上都无法消除漏检、误检,甚至融合后的结果,都可能拉低原有的某单一传感器的检出表现,这一点在Tesla 21年AI DAY AK的报告中已有明确的阐述。
目前所有的你能说的上来的智能驾驶恶性事故,无一例外,车辆都在事故发生的ROI配备着多传感器冗余做融合,然而最后的结果我们也都知道了。
图10 前向冗余传感器ROI内事故
而假设——
1、对于感知:我们不计成本,使用超高算力的SOC,堆叠各类Sensor形成冗余达到完美感知;
2、对于HD—MAP:在一个限定区域内不计成本,所有地图元素均人工标注,给出完全类人的语义信息,并假设能做到实时更新从而获得完美HD—MAP。
我们就能解决城区导航智能驾驶问题了么?答案是不能。因为城区导航智能驾驶最难的部分,其实不是HD—MAP和感知,而是预测和博弈。
4-3 Prediction
预测是使用感知到的目标信息(包括目标heading、速度、加速度、历史观测、目标类别等),辅以高精地图信息(eg:他车在直行车道上,且为绿灯,大概率下来的运动趋势就会直行通过路口),在道交法规或者commen sense的基础上(比如VRU即弱势道路参与群体会遵守红绿灯),对目标交通参与者进行后续3到X秒内的运动趋势(Trajectory,Reachable Set or Occupancy Grid)进行预测。
然而上面的例子可以说是最简单的预测,大家依然可以举出无穷多的反例:他车在直行车道上,但是没有直行,而是左拐了;VRU(弱势道路参与群体)没有遵守红绿灯,直接从遮挡中窜出;再有些公认的更难一些的例子:比如城区的无保护左转场景.....
图11 他车在直行车道上,但是没有直行,而是左拐了
图12 VRU没有遵守红绿灯,直接从遮挡中窜出,实际上这个case其实不是特别极限。
原视频实在是太惊悚了..链接我放在下面
https://www.bilibili.com/video/BV1Ug411a7aG/?spm_id_from=333.999.0.0&vd_source=a37d790330008054e1e6d0d77131fe1d
如果说在只有机动车参与的高速场景下,他车基本上都遵守交规,其意图预测总体可控;那么在城区特别是低速VRU(弱势道路参与群体)比如行人、骑行人的预测基本上等同于“算命”。而在城区场景下,对弱势道路参与群体的预测恰恰是保证ego安全行驶的最高优先级的目标。
诚然,我们可以挤出来一些有限的SOC算力做一些例如行人Skeleton,甚至是Face Detection去给预测提供更多的信息,用以提升预测的准召;但基本可以想象,这也只能非常有限地提升预测模块的能力,而通过skeleton,face detection等肢体语言想准确的预测VRU的行为,可能要 加入预测模型训练大礼包.......
4-4 交互式预测/社会化博弈
(Reaction Prediction或Social Interaction)
下面为了描述方便,将用词统一为“交互博弈”。
首先我们来看一个例子,还是华为-极狐在21年上海车展的城区导航智能驾驶视频节选,横穿的行人明显有一个发现ego以后停止的动作,并在较短时间内起步,再次穿行ego前方。
图片来自42号车库过往的作品。图14 这个场景,经常开车的同学应该很熟悉,很多时候我们开车,发现前方有一个人要横穿马路,踩下刹车,同时行人也看见了我们,也停止了。时间仿佛静止了1秒钟,你发现他没动,他发现你没动,于是你踩油门起步,他迈开腿前进,于是你踩刹车,他停止,于是奇妙的俄罗斯套娃开始了。
视频可以看到类似的套娃式的交互博弈互动,这种博弈天然的存在于ego各种交通参与者之间。类似的问题还有如ramp merge in场景下的ego与他车的博弈,无保护左转下的ego与他车的博弈。可以说,在整个有人类参与的城区的驾驶环境下,极端场景不可穷尽,人类的博弈策略几乎完全无法公式化表达。
图15 实际上,VRU和人类司机一样,存在大量的Legal Norms之外的甚至是Social Norms之外的行为
这也就导致在城区智能驾驶场景下,只要还有人类这种交通参与者存在,就无法“安全地”实现城区导航智能驾驶,更别说一众robotaxi要做的“driver out”了。
如果说感知、预测的问题都可以用数据驱动,靠着model见过足够多的数据来解决,交互博弈我个人认为已经超出了现在人工智能可解决的能力范围了,可能需要所谓的“强人工智能”来解决了。
正是因为城区导航智能驾驶有上述这么多难题存在,很多问题其实连学界都还在研究,是属于问题本身都还没有明确定义的开放问题。本次小鹏,华为-极狐释放城区导航智能驾驶在“跳票”严重的情况下还如此谨慎,仅给极其个别的普通消费者开放,也就成为了意料之中的事情了。
五、与各家已经释放的高速导航智能驾驶相比,城区导航智能驾驶的系统策略有什么不同?
首先说结论:如果说高速导航智能驾驶最高优先级是“保证自己不出事”,那么城区导航智能驾驶的最高优先级是“保证别人(特别是VRU)不出事”。
对于高速导航智能驾驶而言,无论各家怎么宣传,其策略直白点说,都是驾驶体验大于行车安全。各家大可以说自己是L2系统,主体责任在驾驶员。
高速场景相对可控,交通参与实体没有各式各样的VRU,基本上只有各种车辆且绝大多数情况符合一定规则行驶,这个时候只要保证ego没有非常突然或者激进的横纵向行为即可。以Tesla为例,很多时候会忽略大量的风险场景(甚至是系统已经识别并且显示出来的风险场景)。
你能发现在驾驶tesla的过程中,大量的相邻车道车已经越线侵入Ego车道,甚至是在感知他车不准、heading严重摆动的情况下,ego没有任何反应而是维持原有行驶速度和轨迹前进。
而一旦进入城区,在城区导航智能驾驶的场景下,不论各家再怎么说自己是L2系统,承担L2系统的责任,其实都是非常苍白的了。
因为在城区场景下,因为任何一个与VRU的恶性事故,都几乎是一个车企或者供应商不可能承受的,这事实上已经进入了一个对L4级别自动驾驶车辆的要求范畴。
图16 2018年,49岁的Elaine Herzberg在坦佩市,亚利桑那州推着自行车过马路时被一辆正在路测的Uber自动驾驶汽车撞死,该事件直接导致Uber被吊销路测执照,最后整个自动驾驶团队解散
在城区导航智能驾驶需要cover的场景下,安全不再只是ego的安全,而是更多的要保证和Ego交互的城区内各式各样的VRU的安全,这就要求整个系统调教的大策略是安全大于驾驶体验。
这与之前各家释放的高速导航智能驾驶的策略有着设计大原则的本质区别——背后牵扯到感知/预测模块报出策略(如何Trade off precision 和 recall?),博弈/规控模块处理策略(与VRU是否博弈?怎么量化场景处理的激进/保守程度?),系统如何在保证一定体验连续性的情况下确保司机在环,时刻关注ego行为并随时接管车辆?体现着整个系统的CTO/技术领军人的对整个自动驾驶的Insight,技术前瞻性和全系统视角能力。
而这几年很火的数据闭环本质还是用”L2的思想“来解决城区这种L4要求的问题——数据闭环试图用发生事故或潜在事故的弱势场景数据来解决城区导航智能驾驶的问题,这几乎是有些“亡羊补牢”的意味在里面的。
如前所述,不同级别的智能驾驶(L2 VS L4)使用的算法和解决问题的方法论应该是有巨大差别的。本质上,城区导航智能驾驶应用的场景是典型的长尾小样本,而且绝不是Close Set而是Open set的问题,要求在Worst Case下整个算法设计有比单纯的数据闭环复杂的多的保障,整体的Benckmark也要也要更倾向于Worst Case。这也就意味着整个系统准出的Test case分布更倾向于Worst Case从而与符合系统调教的大策略:安全 >>> 行驶体验。
当然,数据闭环虽然不是城区导航智能驾驶的Silver Bullet,但是做做预标注什么的倒是挺好用的。
六、在这种情况下,普通消费者需要注意什么?
直白点说,所有厂商(包括Robotaxi公司)说自己不能宣称L4只能宣称L2是法律法规的原因都是借口。不要管车厂的销售、外面的推广广告如何天花乱坠,大家需要知道的是:
1、现阶段,如果说高速导航智能驾驶确实可以一定程度上减轻人的驾驶负担的话,那么所有厂商的城区导航智能驾驶绝对不能减轻你驾驶的负担,特定场景下绝对会加重你驾驶的“紧张感”
说直白点就是ego会自己产生一些让普通消费者认知范围之外的,意料不到的“迷之操作”并直接引起事故
请时刻关注路况并紧握方向盘!
2、与AEB,ACC等成熟的L1功能不同,不止我们国家,整个业界都没有对城区导航智能驾驶的量产放行标准。各家厂商水平绝对参差不齐,请不要体验过A厂商的功能就觉得B厂商也大差不差,或者看过的网上媒体评测/demo的视频就认为你买的相同厂商的量产车有类似水准。
个别厂商的智能驾驶功能(这里不仅仅指的是城区智能驾驶)还有较大提升空间。
请时刻关注路况并握紧方向盘!
3、就像本文开始说的,城区导航智能驾驶功能由于其体验更连贯、控车更灵活,使用一段时间以后会让消费者逐步信任这个系统,而当人类逐步信任机器的时候,也恰恰也就是事故爆发的开端。
请无论如何熟读厂商给你的用户手册特别是有关智能驾驶的部分,熟悉系统的相关操作并使之成为肌肉记忆,熟知该厂商智能驾驶的弱势场景描述并在使用该功能时不断提醒自己。
总之,无论任何时候,请时刻关注路况并握紧方向盘!
对于这点,我特意翻看了小鹏和华为-极狐的用户手册, 在其智能驾驶章节对系统可能的问题与应对不了的场景有着非常详尽的罗列与描述,各种使用限制,错误与警告,甚至让我觉得看了以后觉得“功能不可用,完全不想开”的程度。然而我认为,这才是对消费者负责任的态度。反观别的一些厂商的用户手册,这一部分的描述可以说一言难尽。以至于我甚至怀疑这些厂商到底有没有做过成系统成规模的泛化场景测试,他们自己到底知道不知道自己的系统有这么多不能处理的场景。
图19 小鹏P5手册中密密麻麻的限制与警告,华为-极狐中也有类似的繁琐章节描述
七、写在最后的话
未来的五年内,是国内城区导航智能驾驶内卷后大爆发的年份,各个公司都会以跑步前进的速度开放这个功能。我们每个在这个行业奋斗,以这个行业作为终生事业的从业者,都应该保持一颗清醒的头脑,本着对客户,消费者,行业负责的态度,推进智能驾驶走进千家万户。
参考文献链接
https://mp.weixin.qq.com/s/AW0B7o306CxUO-_HHF9hsQ
https://mp.weixin.qq.com/s/Mpd2g9sqiCNcTh980JKFDg
https://mp.weixin.qq.com/s/o5BzSRF1avNSjPJPq8LzTQ
https://mp.weixin.qq.com/s/OZgFFUnIfPZo2Cvb21vqMQ
https://mp.weixin.qq.com/s/mHpQNOVVN3dY2eRnTwfj1g