阿里云张新涛:连接产业上下游,构建XR协作生态

简介: 用交互技术辅以澎湃的算力带给大家最真实的“沉浸式体验”

2022年9月2日,在世界人工智能大会“区块新生 数字宇宙——元宇宙技术与生态合作”分论坛上,阿里云弹性计算产品专家张新涛带来了题为《澎湃算力,同频沉浸》的主题演讲,以下为精华演讲内容:

 

大家下午好,我是阿里云弹性计算团队负责异构计算产品的产品经理张新涛。今天我要和大家分享的是:站在公共云的角度如何看待下一代互联网,以及如何去服务下一代互联网。

 

01 交互升级,抽象变具象,沉浸式体验为产业带来变革

 

我们认为不管是当前的“元宇宙”名词提法,还是新的技术浪潮,在我们看来都会把它称为是交互技术的演进。对于交互技术来说其实在过去上百年一直都在不断进展,特别是近几十年发展的非常快,它演进也是有方向的,并且也是有规律可循的。我们看到的是:交互逐渐从单向变成双向,从抽象的信息变成具象的信息。

幻灯片2.JPG

通俗的理解,广播和报纸作为传播媒介,都是以文字内容作为主要支撑,很抽象,同时也很难能够和报纸背后的作者直接沟通,也就是我们所说的交互困难。同理,和一些小说里面的人物去交互沟通,也非常难,因为这都是单向的。但是现在有了交互技术,我们可能戴着一个XR的头盔,就可以在虚拟的世界里和任何一个物体、环境、人实现交互,这也就实现了双向的交互。

幻灯片3.JPG

 

那么实现了有效双向交互有什么样的意义或者作用呢?其实针对这样的双向交互我们视之为现实世界和虚拟世界的融合,这个融合也产生了非常多的好处。现实世界是刚性的,很多东西难以改变,但虚拟世界是柔性的,我们可以任意定制,当我们把现实世界和虚拟世界的特征结合起来,我们就找了另一个解决问题的模型。

 

举个例子:我们想要在某地规划一个CBD,但是无法准确预估CBD建成后对周围交通的影响,从而在建成后造成周边交通拥堵不堪,这种情况在早些时候是时有发生的。而这个时候如果我们把CBD模型放到虚拟城市中,同时把所有的交通要素引入,包括汽车、两轮车、行人等,并放进对应的参数加以仿真。我们就可以预估,在某地建设一个CBD,哪些地方需要调整修改,最终形成了一个模型。总结来讲:就是把现实世界的问题带到虚拟世界里去仿真找到答案,再重新影响现实世界。

幻灯片4.JPG

像这样虚实结合的应用已经非常普遍的出现在了我们的生活和工作当中。比如:在消费端场景中我们常见的各种数字虚拟人,元宇宙演唱会,沉浸式数字博物馆,企业端场景中的各种虚拟仿真系统,数字孪生工厂等等。目前主要的沉浸式应用或者叫做视觉计算应用主要是在这两个比较大的场景里,总结而言带来的优势是:在消费端领域给大家的生活带来的是美好和有趣,在企业端领域带来的是创造力和生产力。

 

这些如此多元宇宙应用的呈现,是需要云计算的,我们看下这些应用对云计算的挑战有哪些。

 

02 阿里云,突破产业链挑战,打通商业协作

 

在我们看来这场新的产业革新是影响到全行业的,所有的元宇宙应用或者视觉计算应用都可以使用这个模型来表示。开发者开发的元宇宙应用,需要通过云端计算能力并借助人机接口设备将虚拟体验带给用户。即便看上去如此简单的模型,在产业实际的落地过程中也面临巨大挑战,挑战的原因来自三个方面:元宇宙产业的技术栈异常复杂,要影响到的行业众多,潜在的用户也是众多。最终带来两个比较大的挑战:技术上的挑战和商业协作上的挑战。

幻灯片5.JPG

 

先来看技术上的挑战。

幻灯片6.JPG

技术方面的挑战主要是计算方面的挑战。过去20年大家都经历了从PC到手机的转变,最重要的变化来自于交互方式的变化。大家的交互从PC时代的鼠键+显示器到了现在多点触控的方式,甚至是在XR头盔和眼镜上使用了手势和语音的交互,这些交互需要更多的计算能力,但是终端的计算能力演进速度却日益捉襟见肘,交互计算负载开始逐渐向数据中心移动。

 

在过去20年间,数据中心的计算力规模扩大了百倍,这里面除了互联网用户增量带来的增量变化而外,剩下是交互方式带来的计算增量,最显著的变化是数据中心出现了异构加速计算。例如:我们常见的手机上的语音识别,购物推荐,刷脸支付,AI相机等等,都需要借助云端AI计算资源协助。到了下一阶段的XR终端更是如此,我们来看看XR阶段有哪些计算需求。

幻灯片7.JPG

 

现在到了XR阶段,对计算的需求更加强烈,甚至是过往需求的数百倍。

 

比如说在XR的场景下就会有三类计算:图形图象计算的挑战、AI计算的挑战、流媒体计算的挑战。图形计算需要始终实现实时的图像生成,AI需要更多,实时对话,实时画面面部表情变化,实时的情绪识别与生成,这将面临巨大的计算增量挑战。除此之外,我们把内容从云端传到用户端,从用户端传到云端的过程中还需要另外一个东西——通信,它需要非常大的带宽以及非常低的延时。

 

总之,计算力的提升要数百倍,通信的能力的提升也要数百倍。

幻灯片8.JPG

我们再看一下商业协作的挑战:元宇宙这个新兴产业的技术栈十分复杂,本质上源于其使用了过去几十年人类成熟和正在演进的所有IT技术。这也导致新产业的商业协作链路十分冗长。我们在过去一段时间对产业进行了认真梳理,将产业模型逐渐简化到五个环节,目前绝大多数客户和伙伴都在这五个环节中。前面有一个嘉宾提到,做一个数字人、虚拟空间等要多少钱,这中间最大的问题是大家的协作效率极其低,使其成本很高,效果也并不理想。如何让大家效率提升,同时做出更多有用的东西,这才是我们的亟待要解决的商业协作的问题。

 

讨论完了商业协作上的挑战,我们来看一下技术问题怎么解决。技术问题前面讲有计算力的挑战,还有一个计算规模的挑战,除此之外还有一个通信的挑战。阿里云过去多年做了神龙计算平台,今天我们升级到CIPU的平台,目的就是为了解决计算性能,通信能力上的技术挑战,除此之外,我们在过去几年GPU实例的计算也增加了百倍来应对AI和图形计算的挑战,GPU计算资源的规模也超过了1700P。

幻灯片9.JPG

这页可以看下第四代神龙计算平台带来的计算和通信能力的提升表现。

幻灯片10.JPG

 

这页来看下现在升级到CIPU之后,带来的规模,稳定性和弹性的巨大优势。

幻灯片11.JPG

 

这页是我们去年发布的第七代GPU实例,这个实例在AI计算和视觉计算性能上都有了显著提升,并且支持第二代实时光线追踪引擎,是个非常适合元宇宙业务的计算实例。

幻灯片12.JPG

虽然看上去技术挑战仍然十分艰巨,但是我们找到了方向,这样实现突破也就相对容易。但是更大的挑战是是商业协作。

幻灯片13.JPG

 

商业协作如何打通?大家可能认为云计算厂商就是提供计算力的,实际上我们认为这对云计算厂商来说这远远不够,为什么远远不够?因为云计算有着非常大的优势,连接需求的上下游,能把所有的需求在这里连通,并且帮助大家做得更好。

 

因此,我们除了把自己的IaaS产品做好之外,还希望把整个产业链前面讲的那五个协作环节高效起来,进而就有了协作体系。这个协作体系主要是分为三层:其中之一是我们会把产业里的共性问题在接口层这里解决掉,比如:提升3D引擎的渲染效率和能力,提升编码和串流的能力等等;进一步地,我们和伙伴合作搭建起来协作平台,我们希望使用这个平台将之前讲到的复杂的协作变得高效起来;最后,我们还面向全行业构建行业编辑器矩阵,或者行业SaaS矩阵,通过低代码的方式让更多行业可以构建自己的元宇宙应用。

 

这里我们先来简单介绍一下协作平台的两个产品:云3D引擎编辑器平台和云XR平台。

幻灯片14.JPG

 

关于协作平台前面很多嘉宾讲到3D引擎,其实3D引擎在这里面起了一个非常枢纽的作用,所有的游戏,元宇宙的应用,3D的应用,都要用3D引擎来开发,用3D引擎的编辑器来开发。但是3D引擎实际上还是有门槛的,无论是技术上的门槛,还是计算力上的门槛,还是整个商业协作环节上的门槛都非常大,可能每一个这种应用都需要带上几百G的素材,也就相当于带上一个非常巨大的计算量。

 

比如说我们做一个东西,做一个烘焙,可能几十个小时就过去了,开发者就要等几十个小时,效率非常低。我们是希望用云的方式来解决,大家可以在各种类型的终端上进行业务开发,开发环境不受限制,计算资源也不受限制,这样开发效率就大大提升了。

 

03 云XR平台发布,支持用户高效部署,落点沉浸式应用

 

那么开发出来的东西部署在哪里呢?其实我们发布了一个云XR平台,这个平台可以支持大家把各自的应用开发出来后直接放到这个平台上,不需要像之前一样开发出来的应用,适配成百上千的这些终端,效率非常高,可能5分钟就可以搭建完成一个云上的元宇宙应用。

幻灯片15.JPG

关于云XR平台大家可能会比较关注的一些特征,如:OS类型,引擎类型,终端类型的支持情况,我们也完成了对nReal眼镜的支持,欢迎大家试用。

幻灯片16.JPG

大家可能关心对开发流程的影响,基本上无任何影响,你无论是2D的应用开发还是3D应用开发,都与过去没有太大区别。

幻灯片17.JPG

最终无论是在云上去创作开发,还是在云上部署,大家环节是没有变的,以及其实我们在云上也落了很多这样沉浸式的应用。

幻灯片19.JPG

幻灯片20.JPG

 

上图是我们客户的一个元宇宙演唱会,作品内容出自我们的合作伙伴。这是在9月4号他们举办的元宇宙演唱会的一些画面的效果,就是在云上实时渲染出来的。

 

我前面讲了汽车产业,其实这些沉浸式的应用或者是叫视觉计算应用,实际上已经能帮助很多产业来解决问题。

幻灯片21.JPG

 

举个例子,现在最热的产业之一:自动驾驶,但是自动驾驶大家会发现有个巨大的问题,它需要上百亿公里的路测,但中国的领先企业,可能只有几千万公里的路测,起步较晚的企业路测里程更短。同时这些路测的成本也非常地高昂,需要买几千上万辆汽车,雇几千上万个司机和安全员去做各种各样的路测,且这个积累的数据量也相当地有限,但是如果我们把它在虚拟世界去做仿真,这个效果将是极其地快速,我们可能说在云上去开数万个GPU实例,用数万片的GPU去渲染出来这样的场景,我们是用数万台虚拟的汽车去跑,而且是24小时不停地跑。

 

由于虚拟世界的柔性可定义,可以定义出来各种路面,光照和环境,这就是使得检测出来自动驾驶程序的各种bug的概率,比在真实路测的条件下要高很多,这是可以正面提高生产效率的。

幻灯片22.jpg

 

除了自动驾驶,健康产业我们同样关注。这是我们一个合作伙伴,他们做了全世界最先进的医学数字人,他们的一大部分的研究方向是研究人体,其实现在很多医学院、医院都需要这样的人体模型,来做术前研究规划,学习等。

 

我们通过视觉计算的方式,很轻松的就可以把这种服务投递给每个需要的机构或者个人,帮助他们高效实现研究和学习的目的。

 

用交互技术辅以澎湃的算力带给大家最真实的“沉浸式体验”,打破技术+商业协作的双向挑战,打通产业上下游,助力其实现高效,相信是每一位同仁们的愿景和目标,也希望终有一天,我们能够看到交互技术真正为全产业的全链路带来新的产业机会。

 

我的分享就到这里,谢谢大家。

 

点击这里,了解阿里云视觉计算解决方案。

 原文链接:https://click.aliyun.com/m/1000358630/

本文为阿里云原创内容,未经允许不得转载。

posted @ 2022-09-19 17:52  阿里云云栖号  阅读(65)  评论(0编辑  收藏  举报