2022.11 冬奥会中的数字人

北京冬奥会,不但是奥运健儿们的竞技场,也是虚拟数字人的舞台。据不完全统计,冬奥会至少出现了28位虚拟数字人,参与公司包括了腾讯、微软小冰、中国移动、新华社、百度、阿里、科大讯飞等20家科技、平台类巨头。
由百度智能云提供支持的AI手语虚拟主播亮相央视新闻,为听障用户提供24小时手语服务,助其即时获得赛事资讯;腾讯3D手语数智人“聆语”也上线央视频,为赛事提供手语解说;中国气象局推出的虚拟数字人“冯小殊”,为观众实时播报观赛气象指数;在谷爱凌摘得大跳台金牌的前夕,其数字分身Meet GU现身咪咕演播室;由科大讯飞打造的央视主播王冰冰虚拟形象,在《冰冰带你说冬奥》专属H5中登场;AI裁判&助理教练“观君”助力我国运动员摘得两金一银;还有新华社数字记者“小诤”继穿越空间站后,这次从火星发来赛事智能分析的特别报道……

其实,虚拟人的概念早已有之。2007年,虚拟歌手初音未来横空出世,人们发现“偶像”还可以并非现实中人。

2012年,以15岁少女为设定的洛天依问世,迅速在中国市场被广泛接受,参与歌曲演唱和节目演出已在过去几年成为常态。

2017年,绊爱打开了虚拟偶像直播的大门,推动了Vtuber群体的产生,并逐步成为现今直播界最火的板块。

根据中国人工智能产业发展联盟发布的《2020年虚拟数字人发展白皮书》定义,虚拟数字人,即具有数字化外形的虚拟人物。简言之,拥有类人的外观、行为、思想(当然也有一些非人的萌系形象,如火星车数字人“祝融号”)。

一般来说,数字人系统由人物生成、人物表达、合成显示、识别感知和分析决策等五大模块构成。这五大模块主要解决虚拟人的两个问题,第一,能否像真人一样表达,第二,能否像真人一样思考。

能否像真人一样表达?解决这个问题的关键在于建模、驱动和渲染三大技术。得益于这三大技术的突破,数字人的质变式飞跃才有了可能。在建模端,具有高保真且能够获取人物动态模型数据的扫描技术已经出现,虚拟数字人在外表上已无限“逼近”人类;在驱动端,智能合成、动作捕捉取得了长足进步,虚拟人的表情、动作开始能达到以假乱真的程度;在渲染端,随着CPU、GPU等硬件能力的提升和算法的突破,成像的真实性和细微度均大幅提升。

以AI气象服务数字人“冯小殊”为例,“冯小殊”的原型是《天气预报》节目主持人冯殊。小冰公司通过深度神经网络渲染技术(Xiaoice Neural Rendering, XNR)及小样本学习技术,仅用1周的时间就完成了对冯殊本人的学习。经过语音、嘴型、人脸渲染专家模型训练,虚拟数字人可以完美地get冯殊本人的嘴部动作、眼部及脸部肌肉之间的协同关系,其面容、表情、肢体动作的整体自然度跟真人几乎无异。


企业与用户互动方式,经历了从官网到公众号、视频号等新媒体的变迁,但这些都是单向输出。相比之下数字人有更强的智能性与互动性,并且数字人不会“塌房”。因此它有成为新一代的企业门户与形象代言人的潜质,未来具有很大市场空间,但如果从加德纳技术成熟度曲线(Gartner Hype Cycle)来看,数字人目前仍处在快速成长的爆发期,离真正的成熟还有很长的距离要走。目前大部分的企业数据智能化的能力尚还处于建立的阶段,且数字人的技术落地依然是高度定制化,应用落地存在相当高的门槛。

可以说冬奥会中展现出的数字人的技术能力,几乎代表了现阶段虚拟数字人的最高水平。在这类资金实力充足的体育盛事中,集中力量打造符合赛事报道的数字人相对容易。但在广泛的落地过程中,虚拟数字人的发展仍存在不少掣肘。如何针对这些痛点,探索新的产品路径,想必是未来几年中众多玩家必争之处。

技术的进步在一点点提升人们对虚拟数字人的期待,但很多时候这种期待会有落空之感。主要原因还在于数字人的“智能化”程度还不够,无法自主和人类互动、交流。能否像真人一样思考?虚拟数字人在接收信息后作出判断、决策、然后再向人类进行反馈,做到这一点,才是真正打开了数字人发展的通达大道。

“数字人”也在卷,就问你怕不怕-51CTO.COM

posted on 2022-03-13 15:37  时间朋友  阅读(887)  评论(0编辑  收藏  举报

导航