汽车赛道的比拼分析
汽车赛道的比拼分析
参考文献链接
https://mp.weixin.qq.com/s/w38azUxQUF9xAF6PmljCFQ
https://mp.weixin.qq.com/s/4v9xpL6oEVMMddciempSTw
https://mp.weixin.qq.com/s/j3MPqyxQ7fKxbAeGyokGiw
https://mp.weixin.qq.com/s/6IUW845tc3ZVmdeWwUceog
比亚迪做对了哪5件事?
9月9日,比亚迪再度让所有人吃了一惊。
▲数据来源:乘联会
据乘联会公布的数据,比亚迪8月份的批发销量为173,977辆,同比增长155.9%。其中宋夺得SUV销冠,秦夺得轿车销量亚军。比亚迪8月的销量已经超过了昔日巨头一汽-大众。
在刚结束的成都车展上,比亚迪展台的人流也是络绎不绝,人气甚至超过了对面的宝马。特别是一个护卫舰07、一个海豹,成了观众打卡的网红车。
,时长04:17
▲比亚迪护卫舰07成都车展实拍
视频时长4分17秒
很多人疑惑比亚迪为什么突然火了?毕竟在暴火的同时它伴随着大量的负面新闻:延续不断的起火、换电池风波、长沙工厂环保风波......
车聚君的经验是:如果一个品牌在负口碑遍地时仍有销量的显著增长,那它一定有几个方面做得过于出色,以至于超过或掩盖了它的负面信息。
那么比亚迪做对了哪些事?车聚君的观察是:五条双线战略,一个螺旋上升精神。
1技术路线:纯电+插电
4月初,比亚迪在港交所发布公告,正式停售燃油车,旗下只保留纯电和插电两种新能源车型。
当欧洲和日本的车企,还在争吵某年某月停售燃油车是不是太激进时,比亚迪已经率先实现了全面电动化。这一举动不但震惊了海外同行,连国内同行也吃惊不小。政治正确的事都宣布过,但真正落地的没几家。
▲数据来源:比亚迪官网
而且有意思的是:比亚迪的新能源战略不偏科。今年4-8月纯电与混动的占比大致维持在50:50左右。这已经和2035技术路线图吻合了。
这相当于,它不但在新能源的大方向上全球领先,在细节上也提前17年达到了行业的期望;在销量上不但实现了新能源领导者,也实现了整个汽车市场的领先地位。这是过去中国汽车市场不曾有过的。
以8月为例,比亚迪的纯电车型售出82,678辆、插电混动车型售出91,299辆,纯电与混动比例为48:52。
也意味着:它的销量占到了当月中国新能源乘用车销量的33%,即每卖三辆新能源就有一辆比亚迪;它的纯电车型销量超过了特斯拉上海工厂的交付量76,965辆(含出口);它即使只拿出混动销量也是新能源第二名的2.5倍。
2003年比亚迪正式组建汽车业务,2006年推出首款纯电动轿车F3e,2008年推出首款插电混动车型F3DM,可以说很早就奉行「两条腿走路」。
当然这一路走得并不顺。早期的纯电动车续航短、充电难、价格高,用户口碑并不好。混动车也不受欢迎,因为纯电续航不足,亏电油耗又高,如果不是为了一张不限行、无购置税的绿牌,鲜有人问津。
这个时期的比亚迪,很大程度就是靠着政策和被动粉丝支撑着。
▲图片来源:比亚迪官网
这种情况直到2020年才有转机。这一年国内新能源在新势力的带动下迅猛发展,比亚迪也被再次激活,它接连发布了刀片电池和DM-i混动技术。前者通过CTP设计提升了磷酸铁锂电池包的能量密度,让电动车在续航与成本之间达成新平衡;后者让混动车可摆脱充电桩的束缚,不充电也省油。
问题依然有,比如去除模组的刀片电池在安全性上有待商榷、也没有实现真正的零起火;DM-i系统不时遭遇「EV功能受限」、还因电池包托盘进水召回;但总体来说,比亚迪的这组技术路线切中了市场需求。
DM车型负责颠覆燃油车市场,EV车型则去争夺电动车市场,「两手都在抓,两手都算硬」。
2细分市场:王朝+海洋
除了在技术上走纯电和插电两种路线外,比亚迪在产品定位上也准备了两条线,那就是王朝系列、海洋网系列。
▲图片来源:车聚网
王朝系列主打「直接感知」的舒适和豪华,说白了就是以看得见的性价比为诱饵,吸引一批又一批不那么懂车的消费者购买。
比亚迪汉将新能源中大型轿车做到了20多万,既能与雅阁、帕萨特们竞争,同时也能上探与凯迪拉克CT5这样的二线豪华车竞争。秦PLUS DM-i则挤占了不少卡罗拉、轩逸们的市场。
当然了,比亚迪也在努力提升王朝系列的溢价能力。比如新一代的汉DM-i、汉DM-p定价明显上扬;宋MAX DM-i和宋Pro DM-i则是将老车型拿出来改造了一下,同样卖高价;这些车型的性价比明显不如秦PLUS、宋PLUS、唐三款初代DM-i车型,但销量一样高走,说明它有品牌溢价了。
品牌溢价的一个标志是:当消费者不知道买什么车时,第一反应是选它。
燃油车时代是大众,后燃油车时代是日系三大,纯电启蒙时代是特斯拉,新能源普及时代则是比亚迪。这个功劳归属于王朝系列。
▲图片来源:车聚网
海洋网主打「深层感知」的性能与智能,以看不见的软实力为主。
比亚迪汉刚上市时,车聚君抢先试驾过:静态体验诚意十足,成熟度像40多岁的中产大叔;但动态体验充满了各种谜之操作,底盘的稳定性不足以应对精力过盛的动力,像一个刚到青春期的13岁少年,惊喜伴随着惊吓。
根本原因是汉EV的平台不是纯电的原生架构,加上前驱布局、后三连杆悬挂、奇怪的各项标定,导致它的驾驶体验比较糟糕,不仅不如特斯拉Model 3,也不如同期的小鹏P7。
一位资深媒体老师这样评价:“汉EV性能版绝对是我2020年试驾过的上百款新车中最让我失望的,没有之一。”
,时长05:40
▲比亚迪海豹成都车展实拍
视频时长5分40秒
最新的海洋网车型明显已经摆脱了老平台的影响。在全新海豹身上,比亚迪做出了本质性的改进。新车用上了最新的e平台3.0,在轴距与汉EV保持一致的情况下,车身削短了180mm,明显在为操控让步。
海豹还用上了最新的CTB电池车身一体化技术、后驱、前双叉臂+后五连杆悬架,整体操控理论上有了质的提升。
如果说王朝对传统的、保守的、温和的消费者保持吸引力,那么海洋会对年轻的、激进的、个性的消费者产生共鸣。
两个系列并行,就像倚天剑和屠龙刀的合壁,有可能让比亚迪大杀四方,俘获各个年龄段、各个城市层级、各种价值观的消费者。
前提是它的宣传不再浮夸、服务不再拉垮。
3品牌划分:比亚迪+腾势
比亚迪最近又做了一个动作:将沉寂已久的腾势品牌重新激活,并将自己在腾势汽车的持股比例增加到了90%。这意味着腾势品牌彻底「改姓」比亚迪,承担起进一步上探的重任。
▲图片来源:微博用户@赵长江V
在之前MPV的文章中,车聚君已提到腾势D9开启预订后,热度相当高。根据腾势销售事业部总经理赵长江的微博描述,仅在上海地区就取得了近2000台的订单。当然,订单不等于销量,比亚迪能否攻下40万级别的市场,还有待观察。
除此之外,比亚迪还规划了一个定位百万级的高端品牌,预计今年年底发布,并会同步亮相首款硬派越野车型。
届时比亚迪将会拥有三大品牌,除了基石品牌比亚迪之外,还有豪华品牌腾势,以及规划中的百万级高端品牌,形成主流、豪华、超豪华的品牌分级。如成行,那将真是一生二、二生三、三生万物。
那么,比亚迪将初步具备国际汽车集团的雏形。
4目标市场:国内+国外
说到国际,比亚迪早就开始拓展海外市场。
▲图片来源:比亚迪官网
2013年,比亚迪就在美国加州建立起了巴士工厂和动力电池工厂,随后进一步将业务拓展到了电动叉车、电动货车领域。
今年7月底,比亚迪宣布正式进军日本乘用车市场,海豚、海豹、元PLUS三款车型亮相日本发布会。
最近传出消息,比亚迪即将在德国、荷兰、丹麦、瑞典四国同时开启三款纯电动车型的销售,最早今年第四季度开启交付,这次带去的车型是比亚迪唐、汉、元PLUS(欧洲定名BYD ATTO 3)。
也许比亚迪的野心,是去通用、丰田、大众的老巢和昔日霸主们正面硬刚?
燃油车时代的主旋律是,外资品牌请进来;当下的新能源时代主旋律是,自主品牌走出去。双线市场,大有可为,不只对于比亚迪。
5供应体系:自研+合作
在新势力们宣扬全栈自研的时候,比亚迪笑了。它早早就开始做供应链垂直整合,虽然早期也有浓重的借鉴痕迹,但至少开了一个自力更生的头。
▲数据来源:SNE Research
到了新能源时代,最重要的零部件自然是电池。
根据SNE Research的数据,1-7月比亚迪的电池装机量达30.3GWh,仅次于宁德时代、LG新能源。考虑到它205%的增速,今年年底前超过LG荣登榜眼易如反掌。
奇妙的是,比亚迪也是世界上少有的既作供应商又作主机厂的企业。
它与丰田合作的首款纯电轿车bZ3即将上市,新车会搭载比亚迪提供的刀片电池,并用上比亚迪的部分平台技术,这几乎可以认为是比亚迪对丰田进行了技术输出。
比亚迪与特斯拉的合作虽然扑朔迷离,但目前基本已经“实锤”,最大的变故无非是合作规模的问题。
最近还传出消息,大众将采用比亚迪的DM-i混动系统,虽然这个信息有待证实,但大概率两者确实有较为深入的接触。
也就是说,全球市值排名前三的特斯拉、丰田、大众,都很有可能与比亚迪展开合作,引进它的部分技术。
与此同时,在刚刚公示完成的第360批新车申报信息中,有三款新车型搭载了弗迪电机,分别是东风Friday、海马7X-E MPV、创维EV6。
博世不敢造车、麦格纳不敢造车、华为不敢独立造车,因为它们担心失去现有客户的信任;但比亚迪既做供应商又做竞争以手,两不耽误,相辅相成。这也是一个奇特的商业案例,供商学院的MBA们津津乐道。
总之,能把「双线战略」玩的这么全面、这么透彻、这么平衡的,确实少见。这与其它车企或全面开花、或聚集战略都不相同,算是独有的比亚迪模式吧。
车聚小结
前一阵儿,比亚迪宣称2023年将冲击400万销量目标。
搁前几年,车聚君会带头嘲笑它。不过现在有「双线战略」的初步成功,还是先保持观望吧。双线战略的核心是左右互持、螺旋上升。比如现阶段海豹的竞争力超过了汉,可能等到新一代DM-i系统上车,汉的竞争力又会反超海豹,王朝和海洋网两大系列相互竞争又互为补充。
从目前的情况看,比亚迪的整体形势相当不错。但希望比亚迪能够保持好心态,在市场上大杀四方的同时,不要忘了是一代一代用户的支持,才让它走到如今的地位,其中很多用户无形之中还当了「小白鼠」。不要忘了用户才是企业立足的根本,像现在汉EV千山翠的电池问题,一定要引起重视,不要让相信自己的消费者寒心。
前景可期,往错勿忘,希望比亚迪与其他自主品牌一起,撑起民族汽车工业的一片天。
更接近人类驾驶,特斯拉FSD来到临界点?
特斯拉FSD再次迎来一轮升级,此次FSD Beta 10.69.2版本实现了部分功能上的细化,已经体验过的用户纷纷给出了其更加接近人类驾驶的评价,它正在迎来临界点吗?马斯克自信地将FSD的售价涨了三千美元。
更接近人类、这是迄今最好的自动驾驶技术。
这是众多Vlog车主在测试9月12日推出的FSD Beta 10.69.2版本之后的评价。
在特斯拉在美国时间9月12日向大约10万名Beta计划参与者推送FSD
Beta 10.69.2版本的同时,马斯克也针对这次更新连发了3条推特。
马斯克表示,真实世界的验证和数十亿英里的实际道路训练将使FSD成为超人,但安全是重中之重,请测试车辆务必谨慎驾驶,尤其是在周围有行人的时候。
尽管FSD正式上市的时间一再跳票,但它如今的每一个版本的更新依然吸引了世界各地的人。
根据马斯克9月6日的“预告”,此次FSD Beta 10.69.2版本的代码改动相对较少,但新的升级将对驾驶体验带来很大变化。
FSD Beta 10.69.2是10.69版本的第二次改进,10.69版本最初推送的时候,只有1000名车主收到了推送。
在经过一系列测试并修正不足之后,10.69.1版本推送给了10000名车主,而此次最新的10.69.2版本则是在此基础之上进一步完善的结果。
目前,新版本的落地正在逐步进行中,有部分已经体验过的车主表示,FSD Beta 10.69.2比以前更流畅、更自信、更灵活,其驾控风格更像人类驾驶员。
有车主表示:“新版本的驾控更加顺畅和自信,车辆会更多地变道和加、减速,其顺畅程度令人感到惊讶。”
另有车主兴奋地表示:“在使用过FSD
Beta 10.69.2之后,我不得不说这是迄今为止最好的一次。操控非常流畅,感觉像人类。”
不过,也有车主提出了不同的意见:“令人讨厌的一件事是,它总是想要换到最右边的车道。应该设置一个偏好开关来供车主选择。”
在特斯拉官方发布的推出说明中,FSD Beta 10.69.2版本的主要升级包括以下几点:
1、增加了一个新的“深度车道引导”模块,该模块将从视频流中提取的道路特征与地图数据融合在一起。与之前的系统相比,这种架构在车道识别方面的错误率降低了44%,从而实现了更顺畅的控制,以适应道路状况的各种变化。
2、驾驶平稳性得到提升,系统将更好地考量从转向、加速、减速命令发出到实际转向执行之间的延迟误差,由此提升系统对车辆行驶轨迹控制的精准性。
3、在路口接近和离开中间交叉区域时,改进了无保护左转的表现,车辆的速度控制更加得当。同时,对正在进入或在中间交叉区域内等待的其他车辆,新版本可以更好地分析它们的行驶意图。
4、可以更加精确地识别低速移动的障碍物,例如体型较小的动物。
5、改善了交通信号灯、交通标志与车道的关联性,提高了车辆右转的平稳性。当没有相关对象存在时,也减少了不恰当的减速操作。
6、通过对行人和骑自行车的行进意图更为精确的分析,减少了在人行横道附近的不恰当减速。
除此之外,FSD Beta 10.69.2版本在细节上的改进还包括:
改进了低速行驶时的车速控制表现,以便在发现障碍物时更好地避免碰撞;
提高了进入高速公路时的速度,增加了并入高速公路的效率;
精确分析行人的运动状态,以便更快识别闯红灯的行为。
在FSD Beta 10.69.2版本开始推送的同时,还有一个值得关注的事情,就是特斯拉已经从9月6日开始将FSD系统的价格提高到了1.5万美元。
在此之前,马斯克认为FSD便宜得离谱,因此在今年1月份将其售价从1万美元提高到了1.2万美元。
马斯克表示:“特斯拉FSD的价值非常高,但大多数人都不太了解它的价值,FSD最终的目标就是实现完全自动驾驶。”
在消费者购买特斯拉车型的时候,所有车辆都标配了基本版Autopilot智能驾控辅助系统,包含有TACC交通感知巡航控制和车道保持功能。
据悉,另外支付1.5万美元购买的FSD系统包括两大部分,其一是增强版Autopilot,功能包括:自动导航、车道变更、自动泊车、车辆召唤和智能召唤功能,它们的价格为6000美元;另一部分,是信号灯识别和停车标志控制,它们的价格为9000美元。
有观点认为,从性价比上考虑,只选择增强型Autopilot或许更加划算。
不过要不要花这笔钱,也看你对马斯克说了两年的将在“今年年底解决完全自动驾驶”是否有信心。
不过,对于这次涨价,有媒体解读为特斯拉落地L4级自动驾驶功能已经近了,车辆在某些场景下实现无需人为干预的自动驾驶已经曙光在及。
但换个角度来看,随着具备智能驾驶功能的车辆增多,消费者盲目信任智驾系统引发的事故也在增加,整个社会对这一系统的安全性正变得谨慎和苛刻。
因而特斯拉在此次FSD Beta 10.69.2版本推送时也鲜有地一再强调要特别注意安全。
今年8月,美国加州机动车管理局认为特斯拉在广告中夸大了高级驾驶辅助系统的能力,有误导潜在客户的隐患。该机构还表示,配备Autopilot和FSD的车辆并不能作为自动驾驶车辆运行。
在德国甚至一度禁止特斯拉用自动驾驶一词进行宣传,不过最终特斯拉上诉之后获得了许可。
同时在技术领域,特斯拉作为“纯视觉”感知路线的坚定践行者,也遭到了不少质疑。自动驾驶能否彻底抛弃雷达传感器而仅靠摄像头来实现,特斯拉正在以“孤勇者”的姿态继续推进。
而每一次FSD Beta版本的迭代都化强化这种信心。
但从销量上来看,2021年特斯拉全球销量达到了93.6万辆,连续4年摘得全球新能源车企的桂冠。
而在2022年第一季度,特斯拉交付了约31万辆,第二季度交付了约25.5万辆。
有分析师预测,其第三季度的交付量将超过42万辆,第四季度有望交付50万辆。
照此算来,到2022年底特斯拉有可能会达到150万辆的交付量。
如此之大的市场保有量,意味着其智能驾驶辅助系统也已经积累了可观的实用数据,这或许是马斯克极度自信的主要原因。
从2020年10月20日开始,特斯拉开始向部分客户推送FSD Beta系统。到目前为止,FSD的测试已经进行了近两年时间,测试用户超过了10万人。
据悉,特斯拉还将允许更多的测试者加入。
马斯克对于FSD的终极目标也即L5级完全自动驾驶,这一目标已宣示了两年多时间,虽一再跳票,但确实牵动着整个行业关注的目光。
在马斯克看来,FSD的每一次更新,都意味着它离这一目标更近了一步,持续推进新功能落地并提高购买价格也就是水到渠成的事情了。
今年中国市场,中国本土势力正在竞争城市NOH场景的落地,但伴随着更多搭载激光雷达车型的上市,与之相匹配的自动驾驶功能似乎要落后一个时段。
虽然我国部分城市正给L3级有条件的自动驾驶松绑,但主机厂在宣传层面正变得谨慎。
FSD正在来到临界点吗?悲观主义者认为,再过50年都无法实现完全自动驾驶,但是人类驾车出行的场景其实是有限的,无论是高速封闭场景还是城市无保护左转这些场景,技术流们正迎来突破,这一天似远正近。
毫末智行:智能驾驶进入3.0时代
当城市NOH逐步落地时,智驾技术迭代的核心逻辑正在发生根本性的变化。
毫末AI DAY
对于关注智能驾驶的从业者而言,截至目前,毫末AI DAY依然还是全球范围内,唯一的智能驾驶技术交流平台。
2022年9月13日,第六届毫末AI DAY如期举行。
中国工程院院士、清华大学教授张亚勤,毫末智行董事长张凯、毫末智行CEO顾维灏、阿里巴巴集团副总裁贾扬清、寒武纪CEO陈天石等行业人士发表了演讲,并分享了一些智驾相关的前瞻性思考。
张亚勤认为,垂直领域的自动驾驶将会更快落地,并逐渐扩散到实现通用自动驾驶能力。
张凯则提出,渐进式技术路线是实现自动驾驶的必由之路。
顾维灏认为,智能驾驶在经过多年发展之后,正在进入以数据驱动为主要特征的3.0时代。
贾扬清则分享了其对自动驾驶领域AI工程化的思考。
陈天石则分享了其对智驾产业发展过程中,计算所面临的挑战和解决方案,并给出从云到端的全栈计算解决方案。
在中美科技战中,寒武纪的全栈解决方案,会是高端GPGPU对中国的禁运的一个有效替代方案。
在AI DAY上,魏牌、毫末和高通再次联合亮相,承诺搭载毫末城市NOH的魏牌摩卡DHT-PHEV激光雷达版将在9月量产,年内发售。
魏牌摩卡DHT-PHEV激光雷达版,有一定的概率会是全球范围内首个落地城市NOH系统的车型,它将会与小鹏G9角逐这一桂冠。
但是,魏牌摩卡DHT-PHEV激光雷达版,肯定会是全球范围内首个落地的、不搭载高精地图的、拥有城市NOH系统的车型。
张凯指出,魏牌摩卡DHT-PHEV是毫末智行实现的第10个带有高级辅助驾驶能力的量产车型,该公司同时还在推进31个量产车型项目。
这些车型的陆续上市,将会帮助毫末智行实现未来两年“高阶智能驾驶车队规模达到100万辆”的目标。
此外,到2023年底,该公司还计划在国内100个城市落地城市NOH。
截至目前,这也是唯一一家提出类似目标的智能驾驶公司。
为支持上述目标的实现,毫末智行联合其生态伙伴,发布了两项智能驾驶AI训练的产业基础设施:
1.毫末智行超算中心。
这是继特斯拉Dojo、小鹏“扶摇”之后中国第二个智能驾驶超算中心,全球第三个超算中心。
2.实景仿真系统。
毫末智行、阿里云、德清市政府在活动中宣布,发布“中国首个基于车路协同云服务的大规模自动驾驶场景库”。
该场景库主要聚焦了各式各样的路口信息,将采用真实的路口摄像头信息,并将其引入仿真系统,使得智驾模型可基于真实路口模型验证算法可靠性。
在顾维灏看来,该公司所有的工作和发布,都围绕着一个重要的智驾产业变革:智能驾驶产业,正从2.0时代进入到3.0时代,从软件驱动技术迭代,向数据驱动技术迭代阶段迈进。
自动驾驶3.0时代
现代智能驾驶产业,大概从2009年起步。
作为国内最早研究量产智能驾驶的从业者,根据驾驶里程、感知、认知和迭代模式四个维度,顾维灏将自动驾驶产业的发展分为3个阶段:
分别是“硬件时代”、“软件时代”和“数据时代”,并将其定义为自动驾驶1.0时代、自动驾驶2.0时代和自动驾驶3.0时代。
时间划分上,顾维灏认为,2018年、2019年之前,都可称为以硬件驱动的“自动驾驶1.0时代”。
在那个时代,车上挂满了各种激光雷达、堆满线束、塞满计算机器……硬件性能的提升,驱动智能驾驶能力的进步。
在那个时代,驾驶里程通常以100万公里计,在感知上,以激光雷达为主,在认知上,主要基于规则进行决策规划,在技术迭代上,由硬件迭代驱动。
在2018年、2019年的时候,顾维灏认为,自动驾驶开始进入到以软件为主要驱动力的2.0阶段。
在那个时代,自动驾驶技术开始在量产车上规模化落地。
自动驾驶产业已不能靠不计成本地堆硬件提升系统的能力,车规级的硬件,有严格的功能和成本要求。
在那个时代,驾驶里程以千万公里计,在感知上,各个传感器各自为战,用一些小模型和少量数据做训练,得到单个传感器的识别结果,然后进行感知结果级的融合,在认知上,还是以规则为主进行决策规划。
在自动驾驶2.0时代,技术迭代由小模型和小数据驱动,或者说软件能力驱动。
在2022年底、2023年初,顾维灏认为,自动驾驶开始进入3.0时代,特斯拉是这个时代的典型代表。
在这个时代,驾驶里程以亿公里计,在感知上,以视觉和融合感知为主,在认知上,则用AI模型解决决策规划问题。
在自动驾驶3.0时代,技术迭代由大模型和大数据驱动,数据规模将会成为智能驾驶的核心竞争力。
顾维灏为自动驾驶3.0时代定义了几个重要的特征:
1.算法模型以大模型为基础。
2.训练数据基于亿公里级驾驶里程,这些数据将无法采用人工标注,训练方式只能采取无监督学习方式进行。
3.决策规划采用AI模型。
顾维灏认为,上述几个条件,是智能驾驶不断迭代发展并实现高阶智能驾驶的必由之路。
在被问及小模型小数据和大模型大数据之间的区别时,顾维灏指出,小模型和大模型的核心区别在于参数规模:
小模型参数规模级别为几百万个参数,而大模型参数规模达到1000亿个以上,比如谷歌的GPT-3模型的参数规模达到了1750亿个。
小数据和大数据的核心区别在于数据是否由人工标注:
对于小规模的数据集而言,由人工标注是可行的和成本可控的;但涉及亿公里这种当量的数据集,采取人工标注的成本无法承受。
这些无标注的海量数据直接被用于大模型的无监督训练,是大模型大数据的特点。
顾维灏指出,在智能驾驶领域,Transformer模型和原先的CNN技术路线相比,结合海量数据,其模型收敛的训练时间只需原来的三分之一,而模型精度显著提高。
Transformer大模型在城市NOH领域的一个现实优势是,依托于时序BEV机制,可高效地实时感知三维空间信息。
这是特斯拉能够不依托于高精地图,就可实现高级别辅助驾驶的原因。
利用Transformer大模型,毫末智行是全球范围第二家、中国第一家,在不依赖高精地图情况下实现城市NOH的公司。
自动驾驶的大模型大数据时代的到来,主要是基于以下两个方面的原因:
一方面,智驾开始进入到城市NOH时代。
与此前的低阶辅助驾驶和高速NOH相比,城市NOH的难度系数和数据规模,都有了质的跃升。
在难度上,顾维灏认为,由于城市道路养护活动频繁、车流密集、变道空间狭窄、交通环境复杂等因素,智能驾驶的难度与之前相比,提升了不止一个数量级。
在数据规模上,城市NOH的使用频率和高速NOH相比至少高一个数量级,而在接管频次上,城市NOH也将显著高于高速NOH。
上述因素综合作用,将会使城市NOH所产生的数据规模比高速场景至少高出2个数量级。
高技术难度和大数据规模,是当下智能驾驶实践的典型特征。
这是大模型大数据技术路线产生的现实需求。
另一方面,大模型大数据也是AI技术的趋势。
据顾维灏介绍,自2014年起,基于Attention机制的大模型开始应用在NLP领域并获得成功,使得Transformer模型统治了NLP领域。
2020年,Attention机制在计算机视觉领域大获成功,Google的ViT模型和微软亚洲研究院的SwinTransformer刷爆各大CV比赛的排行榜。
这使得Transformer模型继完成了NLP领域的垄断之后,开始占领CV领域的阵地。
此后,非常迅速地,各种基于Attention机制的多模态大模型奔涌而出,并涌现了Graph Attention等各类变种,它们可以接受多种不同模态的输入——语言、图像、视频、语音等等,也可以输出多种模态,在各个领域都取得了惊人的效果。
据顾维灏介绍,截至目前,基于Attention机制的transformer结构似乎能成为一种有效的通用AI模型范式。
基于Attention机制的大模型,正在成为AI技术发展的趋势。
最后,由于像高通骁龙Ride、英伟达Orin X、地平线J5等大算力车端芯片的量产,也使得像Transformer这样的大模型在车端落地应用成为可能。
技术挑战
大模型大数据驱动的智驾算法迭代模式,有很明显的优势,但也有很大的技术挑战。
一个最明显的挑战是,如何将基于Attention机制的大模型在智驾领域落地,既包括云端的训练,也包括在车端的落地。
在云端训练方面,毫末智行在进行模型切换时,做了很多的基础工作,包括:
训练平台的改造升级、数据规格和标注方法的切换准备,和针对感知、认知具体任务的模型细节探索等等。
当然了,核心挑战之一是启动无监督学习。
毫末选择的方式是将所有的感知任务backbone都统一,然后利用无标注数据先训练好这个统一backbone并锁定,模型剩余部分再用标注样本来训练。
当然了,这并不容易。
在实现无监督学习之后,智能驾驶才会启动真正意义上的大数据驱动模型迭代时代。
在车端落地大模型,算力无疑是最大的挑战。
在云端训练,算力的供应理论上是无限的。
在车端,则由一块360TOPS的高通骁龙Ride提供计算,尽管这已经是当下最强大的终端AI计算平台之一,但如何能够让大模型流畅地跑在这个计算平台之上,依然需要一些办法。
顾维灏指出,尽管大模型的算力需求是小模型的100倍,但这些算力之中,大概只有6.9%的算力贡献了94%的价值,剩余的算力在做大量的弱关联的计算,效率并不高。
基于上述发现,通过优化车端模型,大幅减少弱关联计算,可显著降低模型对算力的消耗,又不会影响模型的精度。
相同的工作可在芯片层面上进行。
此外,还可在数据的调度、算力的利用率方面进行优化,提升计算效率,使得大模型可在车端实现落地。
除了大模型在车端的落地挑战之外,顾维灏认为,将基于Attention机制的大模型应用于智能驾驶,还面临两大核心挑战:
1.如何通过低碳超算,降低智能驾驶训练成本。
2.如何组织数据,让大模型发挥更大的作用。
在大模型对算力的消耗方面,毫末智行提供了一组CNN模型和Transformer模型在训练中对算力需求的对比图:通常情况下,训练大模型所需算力是小模型的100倍。
这将会极大地提升智能驾驶模型训练的成本,包括资金成本和时间成本。
如何降低超算成本?
毫末智行做了多方面的研究并分享了一些具有启发性的成果:
1.使用增量学习,提高新数据使用效率。
在此之前,智能驾驶行业的模型训练比较低效的一个原因在于:每次增加新数据的时候,所有的模型都需要在全量数据(即存量+增量数据中)重新训练一遍,包括感知模型、决策模型。
在训练完毕之后,还需要再走一遍验证流程(包括仿真验证和场地验证)之后,才会通过OTA部署到车端。
毫末智行是国内第一家提出增量学习概念的企业,即有了新的corner case数据之后,模型只针对新数据和少量存量数据进行训练。
在使用了这个方法之后,毫末智行在训练端的算力用量降低了80%,训练时间只需要原来的六分之一。
这不仅可大幅降本,还可在更短的时间解决掉智驾系统的corner case问题。
2.使用实景仿真。
智能驾驶的仿真系统,是验证模型的关键基础设施。
仿真系统与现实用车场景越接近,智驾系统验证和“回炉”再训练的成本就越低。
通常情况下,如果使用手工打造仿真系统场景库,每一个“人日”的产出大概是20-30个场景,非常低效。
鉴于此,毫末智行采取自动生成仿真场景库的解决方案,可基于一些给定的设定,瞬间生成海量的驾驶场景。
但这也会面临一个问题,即自动生成的场景,它的难度是否是合理的?
比如说,一个十字路口,可以自动生成100个不同难度的驾驶场景,但对于智能驾驶算法而言,是否有必要通过自动生成的、最难等级的十字路口场景,才可算合格?
如果是这样的话,则意味着根据现实场景中的corner case训练出来的智驾算法,有很大概率会无法通过仿真验证而不得不回炉再训练。
整个模型再训练一遍,一周时间又搭进去了。
引入实景仿真的价值在于,在采集了很多现实交通场景中的十字路口驾驶模型之后,智驾算法在仿真系统的验证就有了一个现实的边界,它无需再去挑战最hard的场景,而是在顺利通过现实场景之后,即可被证明是有效的。
这是毫末联合阿里和德清市,推出十字路口实景仿真的价值所在。
顾维灏指出,在城市智驾场景,十字路口是挑战最大的场景,基于私家车采集的路口信息缺少一个上帝视角而无法看到全景,在红绿灯上的摄像头的优势是能够看到全景。
3.打造超算中心。
在当天,毫末智行正式发布了该公司的超算中心,该超算中心的目标是,支持千亿参数的大模型,在训练数据规模为100万clips的情况下,训练成本低至原先的二百分之一。
顾维灏指出,在通常情况下,一个千亿参数大模型,在100万clips数据规模的情况下,如果在一个拥有1000块英伟达A100 GPU的数据中心训练,需要花费几个月的训练时间。
这样的效率显然是无法接受的。
顾维灏的计划是将训练时间降低为原来的二百分之一。
在解决了低碳超算问题之后,大模型大数据的第二个挑战是,如何组织数据让大模型发挥更大的作用。
在这方面,顾维灏以谷歌最新的PaLM模型为例进行介绍。
PaLM是一个拥有7800亿个参数的自然语言处理模型,在经过了一个拥有7800亿个token的数据集训练之后,该模型在204项基准测试中的平均水平超过了人类。
在对数据集进行了研究之后,顾维灏发现,这些用于训练的大规模的无标注数据中,只有很少的结构化数据,即除了wiki百科、新闻、书籍是结构化数据之外,其他的都是非结构化数据。
顾维灏发现,基于大模型用于智能驾驶训练的数据与基于小模型的数据截然不同。
在大模型时代,一方面,数据的规模要足够大,另一方面,数据的多样性要足够充分。
在数据规模方面,他认为至少需要1亿公里的智驾里程数据。
在数据多样性方面,他认为各种传感器的数据,包括不同类型、不同像素、不同角度对于大模型训练都有非常大的价值;同时,对于不同的场景,包括不同的道路形态、不同的交通流密度、不同的自然环境都是非常有价值的。
这看起来比较反常识,让直接做L4技术路线的友商们难以苟同。
按照顾维灏的逻辑,这里的挑战是两个:
1.获取足够多的数据。
这是量产智能驾驶的优势。
毫末智行公布的数据是,截止2022年9月13日,该公司的辅助驾驶总里程已经达到了1722.74万公里。
目前已有10个车型搭载该公司的智驾系统,可提供驾驶里程数据,同时在开发的车型数量为31个。
2.如何组织数据。
数据的组织是与模型训练方式匹配的。
在毫末智行,他们将数据分为两类:
一类是无标注的大规模、多样化数据,这类数据通过无监督学习,用于大模型的预训练。
一类是原先已经做好标注的场景数据,这类数据用于大模型的启发式训练。即大模型在完成预训练之后,在一些关键场景,用标注数据再次进行训练,让大模型对一些特定场景的处理能力显著提升。
每一家试图进入到新智驾时代的玩家,都需要解决上述问题。
顾维灏认为,截至目前,真正意义上进入到数据驱动的3.0时代的智驾公司只有特斯拉一家,他希望毫末智行能够成为第二家进入到智驾3.0时代的公司。
行业剧变
当产业进入自动驾驶3.0时代以后,将会对产业格局带来显著的冲击。
1.直接做L4模式压力与日俱增。
直接做L4模式属于典型的小模型小数据模式。
通常情况下,这种模式的车队规模在1000辆以内,通过安全员的测试获取驾驶里程信息,这些驾驶里程信息在经过人工标注之后,被用于作为训练的数据集。
在获得新的数据集之后,通常会重新训练模型,在模型收敛之后,在仿真系统上进行验证,在仿真系统的验证通过之后,进入封闭场地验证,然后再进入公共道路继续测试……
上述过程周而复始,但始终不能大规模落地到量产车上。
由于车队规模上的劣势,使得直接做L4模式在获取增量的规模数据上,与量产车的差距与日俱增。
2.不能获得数据的智驾平台压力与日俱增。
据一些不愿具名的业内人士透露:在当下,一些第三方平台与传统车企合作时,无法获取车企的驾驶里程数据。
这使得这些第三方平台,无法获得闭环数据,让智能驾驶的算法模型持续迭代。
在这里,呼吁传统车企,如果还想让第三方自动驾驶平台在这场竞争中存在下去,需要乐于分享数据。
3.没有销量规模就无以言智能驾驶。
这也是显而易见的。
当然了,在这里,如果你的智能驾驶系统体验很差,用户买了之后不用,也将会导致贵司在数据驱动的智能驾驶研发竞争中处于被动境地。
这也是为何一些车企开始采取标配智能驾驶系统的定价策略。当然了,一些车企只需标配部分功能就可以获取驾驶里程数据,比如特斯拉。
4.大算力车端芯片普及速度提升。
在大模型时代,中低端智驾芯片无以支撑大模型智驾算法模型的计算要求,比较难支持能力的快速迭代。
鉴于此,在自动驾驶3.0时代,大算力车端芯片快速普及将会成为必然。
这对于高通骁龙Ride、英伟达Orin X、地平线J5们而言,会是一个振奋人心的消息。
同时,我们也希望市场规模的扩张,能够让这些芯片的价格得以显著下降。
在成本控制上,特斯拉Hardware4.0将会为我们树立新的标杆,也将会是智能驾驶硬件系统性能和价格的演进方向。
5.智驾的云计算基础设施需求爆发。
当智驾进入到以大模型大数据为核心特点的3.0时代时,这个行业对云计算基础设施的需求必然会产生爆发式增长。
以特斯拉为例,该公司在2021年AI DAY上透露,他们拥有三大数据中心:
数据中心1用于自动数据标注,总共有1752块英伟达A100的GPU,用于训练的数据中心2有4032块A100,用于训练的数据中心3拥有5760块A100,总的算力达3.5EFLOPS。
在2021年9月之前,特斯拉所需算力在过去2年增长了10倍。
基于此,该公司在2021年9月发布了Dojo,除了自研云计算基础芯片D1之外,还自研了整个云计算硬件集群和软件系统。
据特斯拉透露,Dojo在投入使用之后,与A100为基础的集群相比,性能提升4倍,相同能耗下可提供1.3倍算力,占地面积降至原来的五分之一。
这也是为何,小鹏汽车8月2日在乌兰察布发了超算中心“扶摇”,算力达到了0.6EFLOPS。
这也是为何,毫末智行在今天发布了该公司的超算中心,并计划将整体训练成本降低到原先的0.5%。
6.毫末和蔚小理特们获益。
在自动驾驶3.0时代,以毫末和蔚小理特为代表的量产模式,将会在竞争中处于有利地位。
直接做L4的公司恐怕很难follow这种模式,他们需要找到自己的破局之道。
总结
顾维灏认为,毫末智行模式是为自动驾驶3.0时代而生的模式。
一方面,他们拥有科技公司的基因和技术,在应用和落地创新AI技术方面拥有优势;另一方面,他们拥有传统车企车队规模,能够为大模型带来大数据。
在实现真正意义上的自动驾驶之后,可以向包括末端物流等所有需要智能驾驶的关键场景进行商业模式的扩展。
从另一个角度看,毫末智行模式,本质上是一种科技公司与传统车企紧密捆绑的模式,长城为毫末提供数据,而毫末助力长城实现智能化转型。
L3是智能驾驶赛道中的一段弯路
在9月1日的2022世界人工智能大会(WAIC)上,百度创始人、董事长兼首席执行官李彦宏发表了题为《人工智能与实体经济“双向奔赴”》的主旨演讲,李彦宏认为,过去的一年,无论是在技术层面还是在商业应用层面,人工智能都有了巨大的进展,有些甚至是方向性的改变。其中在自动驾驶领域,李彦宏强调“L2之后率先进入商用的可能是L4,而不是L3。”给出的理由是,L2和L4的事故责任界定都很清楚,L2责任在司机,L4运营商要为事故负责,而L3就不一样了,司机需要随时承担对车辆的接管任务,这就使得事故责任难以界定。
此外,智驾最前沿在知乎上也遇到一个很有趣的提问:为什么说L3是智能驾驶赛道中的一段弯路。无论是李彦宏对于自动驾驶会直接进入L4阶段的判断,还是知乎上知友对于自动驾驶L3阶段的提问,都剑指一个问题,那就是自动驾驶L3阶段。美国汽车工程师学会(SAE)根据自动驾驶汽车智能化程度的不同,将自动驾驶分为了L0~L5共6个等级,体现了自动驾驶技术从驾驶辅助阶段向自动驾驶阶段的过度。
自动驾驶分级 |
名称 |
定义 |
驾驶操作 |
周边监控 |
接管 |
应用场景 |
L0 |
人工驾驶 |
由人类驾驶员全权驾驶车辆 |
人类驾驶员 |
人类驾驶员 |
人类驾驶员 |
无 |
L1 |
辅助驾驶 |
车辆对方向盘和加减速中的一项操作提供驾驶,人类驾驶员负责其余的驾驶动作 |
人类驾驶员和车辆 |
限定场景 |
||
L2 |
部分自动驾驶 |
车辆对方向盘和加减速中的多项操作提供驾驶,人类驾驶员负责其余的驾驶动作 |
车辆 |
|||
L3 |
条件自动驾驶 |
由车辆完成绝大部分驾驶操作,人类驾驶员需保持注意力集中以备不时之需 |
车辆 |
|||
L4 |
高度自动驾驶 |
由车辆完成所有驾驶操作,人类驾驶员无需保持注意力集中,但限定道路和环境条件 |
车辆 |
|||
L5 |
完全自动驾驶 |
由车辆完成所有驾驶操作,人类驾驶员无需保持注意力集中 |
所有场景 |
在自动驾驶分类中,对于L3级自动驾驶的定义是:由车辆完成绝大部分驾驶操作,人类驾驶员需保持注意力集中以备不时之需。从定义中我们可以知道,在L3级自动驾驶阶段,车辆在限定场景中已经可以完成绝大部分的自动驾驶要求,此时对于交通环境的感知主要由车辆来进行,车辆可以对行人、其他车辆、交通标识等信息进行准确的读取和分析,且可以灵活处理大多数可能发生的危险。但此时自动驾驶汽车依旧存在对于部分交通状况辨别不及时的可能,需要人类驾驶员随时关注自动驾驶汽车周边的交通环境,可以随时对自动驾驶汽车进行监管。
中国对于自动驾驶智能化程度也提出了自己的分类标准,2021年8月20日,由工业和信息化部提出、全国汽车标准化技术委员会归口的GB/T 40429-2021《汽车驾驶自动划分级》推荐性国家标准由国家市场监督管理总局、国家标准化管理委员会批准发布(国家标准公告2021年第11号文),该标准已于2022年3月1日起开始实施。(后台回复“40429”,获取《汽车驾驶自动化分级》)。在该标准中,根据在执行自动驾驶任务过程中自动驾驶系统于驾驶员参与驾驶控制主次,将自动驾驶划分为0级至5级,共6个等级的驾驶自动化。
在该标准中,对于3级驾驶自动化的定义为:3级驾驶自动化(有条件自动驾驶)系统在其设计运行条件下持续地执行全部动态驾驶任务。自动驾驶系统已经可以独立完成部分驾驶场景中的自动驾驶的功能,驾驶员只需要完成安全员的角色,监管自动驾驶系统的驾驶行为。自动驾驶系统只需要在遇到不能完成驾驶行为的场景或自动驾驶系统功能失效时向安全员提出请求让其介入驾驶行为,在请求安全员介入驾驶行为过程中,自动驾驶系统还是可以独立完成一段时间的驾驶,以便让安全员做好接管的准备,如果安全员长时间没有根据自动驾驶系统要求阶段车辆,自动驾驶系统可以适时采取减缓车辆发生危险的措施。两个自动驾驶等级对于L3级自动驾驶的描述,都明确了在L3级自动驾驶时,车辆已经可以在固定场景中完成自动驾驶,但由于自动驾驶性能的不足,依旧需要驾驶员随时监管。在此阶段有一个问题,就是驾驶员何时需要监管?自动驾驶系统和驾驶员责任应该如何划分?驾驶员是否会因为过度信任自动驾驶系统而造成更为严重的事故?随着高级辅助驾驶系统的出现,越来越多中低级车辆也实现了配备,且随着更多可以直接参与到驾驶过程的主动安全的高级辅助驾驶系统得到应用,L2级自动驾驶时代已经到来。随着L2级自动驾驶的到来,L3级自动驾驶已经很多圈内人士也对L3级自动驾驶的发展提出了自己的观点,且有很多人对L3级自动驾驶的商用化并不推崇,究其原因有2个部分。其一是L3级自动驾驶中,主要是由车辆来完成驾驶过程,这就对自动驾驶技术要求非常高。自动驾驶的实现离不开感知、决策、控制(执行)三大要素,只有这三大要素均实现L3级自动驾驶要求,才能在技术上实现L3级自动驾驶。感知即通过激光雷达、毫米波雷达、车载摄像头等硬件感知设备,实现对交通环境的信息获取,对于这一阶段的技术要求,则是如何让自动驾驶汽车可以“看”得更多,“看”得更清,这就要求硬件技术达到车规级要求。决策即自动驾驶汽车的大脑,如何让自动驾驶汽车可以在看到交通环境后对其分析,并做出判断是十分重要的,因为这是决定自动驾驶汽车是否可以自己走的重要因素,而这一部分恰是最难的,因为自动驾驶汽车参与交通时,不仅仅需要遵守交通规则,还需要在出现突发状况时,可以及时做出反应,且应对措施需要符合人类的处事准则,则其实是非常难的。控制(执行)则是决定L3级自动驾驶汽车是否可以走的重要因素,这一部分就类似人类的双腿、双脚一样,将决定自动驾驶汽车是否走的顺畅和平稳。此外,对于L3级自动驾驶的技术发展,并不能仅仅考虑技术的叠加,还要考虑成本的高低,L3级自动驾驶技术想要实现落地,首要做的还是消费者是否可以消费得起,如果一味追求技术上的达标,而将实现的成本提得非常高,将让L3级自动驾驶更难落地。其二正如李彦宏所述,L3级自动驾驶对驾驶责任的划分并不明确,出现事故难以定夺,智驾最前沿之前曾讨论过相关的话题(相关链接:自动驾驶,跳过L4),其中就讨论了人类在面对非成熟的自动驾驶时的态度。由于在L3级自动驾驶阶段,对驾驶的责任划分并不明确,且主要的驾驶操作是由自动驾驶系统来完成,这将让驾驶员误认为自动驾驶技术已经非常成熟,即便在这一阶段,驾驶员还是要承担对交通环境观察的任务,但是在多次使用自动驾驶功能,且没有发生任何事故后,驾驶员将会产生惰性心理,对自动驾驶系统产生足够的信任,就不会再去观察路况,而L3级自动驾驶并不是非常成熟,此时就非常容易造成事故的出现。其实现阶段已经有很多类似的事故发生,2022年8月11日,小鹏P7在高速公路上开启自动驾驶系统,以80 km/h的速度行驶,但是在前方有人时,自动驾驶系统功能失效,并未感知到行人,径直撞上去,此时车主也没有将心思放在观察路况上,这也是导致事故发生的主要原因。由此可见在L3级自动驾驶阶段,事故的发生率可能会更高,这将导致消费者对自动驾驶的信任感更低。
为什么说L3是智能驾驶赛道中的一段弯路,这里的弯路,指技术上的弯道超车,现阶段各车企对于L3级自动驾驶技术的掌握均为成熟,各行业从业者都处在研发L3级自动驾驶的阶段,也是弯道超车的好时机,谁能掌握技术更强,成本更低的L3级自动驾驶技术,将在自动驾驶赛道中获得足够的优势。
为什么说L3是智能驾驶赛道中的一段弯路,这里的弯路,也是指落地的难度将会十分大,如何让消费者能够按照既定要求使用L3级自动驾驶,如何让大众放弃驾驶的主动权,让自动驾驶系统来开车,认可L3级自动驾驶将会有很大一段路程要走。自动驾驶的落地或许会非常困难,想要让自动驾驶可以快速商用化,最好的办法或许就是:直接跳过L3!
参考文献链接
https://mp.weixin.qq.com/s/w38azUxQUF9xAF6PmljCFQ
https://mp.weixin.qq.com/s/4v9xpL6oEVMMddciempSTw
https://mp.weixin.qq.com/s/j3MPqyxQ7fKxbAeGyokGiw
https://mp.weixin.qq.com/s/6IUW845tc3ZVmdeWwUceog