15年华为云视频架构师采访实录:揭秘未来音视频行业的科技趋势!

摘要:“ 随着互动、云游戏等低时延的需求出现后,我们需要重新思考这个系统的定义,首先想到的就是我们是否要把他们看成一个系统,看成一个系统的好处是,这样有助于帮助我们回到诉求的原点,并重新思考如何解决问题。“华为云视频架构师黄挺在采访中的这段话,点明了未来将会打开系统边界以求创新点的思维模式。接下来让我们回归采访中,细听他在音视频技术方面的分享。

以年轻的、分享的心态拥抱技术

LiveVideoStack:请老师介绍一下自己以及您近期关注的技术趋势和产品?

黄挺:一方面是个人兴趣,一方面是工作需要。我一般会在Linkedin上关注某个领域的专家来获取我希望获得的信息,包括技术的和产品的。专家的来源主要包括:一些论文的作者以及一些技术分享的分享人。通过他们也能够认识很多有趣的人以及最新的产品和技术趋势。我关注的技术比较杂,从API设计,到架构设计,在到视频领域相关的技术,最近因为工作原因,对RTC的一些技术关注比较多。

LiveVideoStack:入职华为以来,您所参与的最难忘的项目是什么,可以与LiveVideoStack的读者分享这其中的一两个小故事吗?

黄挺:2017年在爱尔兰为期1个月的招聘工作让我非常难忘。因为这段时间专职做招聘工作,所以从关注事转变成对人的关注更多。这段工作经历让我接触到了非常多优秀的人,他们有一个共同特质就是技术上乐于分享,能够深入简出地讲清楚一个事情。

同时当地有非常成熟的线下交流平台Meetup,以及非常好的技术交流氛围。有乐于从事公众服务的活动组织者,有活动赞助者(一般是公司)提供场地,参与者有高校老师,也有公司技术专家,有求职者,也有求知者。每个人都能从中得到收获。

LiveVideoStack:您入职华为到现在已经15年了,一直没离开过。华为最吸引您的是什么,在这期间您眼中的华为历经了怎样的变化?

黄挺:华为就像一坛老酒,越品越有味道。无论是对技术还是对项目、对人才,华为都有一整套的管理模式体系,值得我们细细品味其中的奥妙。另外就是华为研究什么的都有,虽然我在华为工作了15年,但是每过一段时间都会听到一些非常有趣的技术探索方向。

LiveVideoStack:在您探索视频传输及相关解决方案的过程中,遇到的印象深刻的难点是什么?

黄挺:虽然我一直从事视频领域相关的工作,做过的产品看似都一样,但其实有很多本质上的差别,这个就是我认为是最大的难点。因为一旦使用惯性思维做新的方向,很容易走偏,越努力可能错的越多。这也是我这次分享最希望能够带给大家的启发。

LiveVideoStack:在您的技术进阶之路上,给您启发最大的是什么?

黄挺:每个阶段都有一个人对我们都有非常大的帮助,我想我的导师是在技术上对我的影响最大的人。我刚入职1年的时候,有一次谈话,他告诉我技术人要做一个扫地僧。正是因为这句话,让我在浮躁的年纪能够静下心来做技术研究,在面对多次内部团队和组织调整的时候能够不忘初心,始终在技术领域保持好奇心,坚持做有价值的事情。

回归本质,让技术产生更多可能

LiveVideoStack:从一个纯粹的音视频技术人的角度来看,您如何理解华为云提出的新媒体网络的价值主张以及其对行业生态的影响?

黄挺:播放、传输和计算(媒体处理、转码等)是相对独立的系统,独立的好处是可以独立演进发展,互不干扰且简单易用;劣势是效率上存在一些损耗。

随着互动、云游戏等低时延的需求出现后,我们需要重新思考这个系统的定义,首先想到的就是我们是否要把他们看成一个系统,看成一个系统的好处是,这样有助于帮助我们回到诉求的原点,并重新思考如何解决问题。

基于这个思考,我们希望通过端边云协同式架构创新,将原来在终端上运行的计算密集型的图形处理算法,放到边缘或云端来运行,这个本质上就是打破原来三个系统的边界,提供了一种新视频应用的开发方式。对于应用开发者,不需要适配多种终端,也让产品经理有更多想象的空间,重新定义更加有竞争力的视频体验。希望通过我们的技术创新,可以丰富大家的技术选择。

LiveVideoStack:一个可扩展的、可靠的、经济高效的视频传输方案应该具备哪些特质?

黄挺:这是一个架构问题。基于互联网的web生态为什么非常繁荣,和它有一个可扩展的、可靠的、经济高效的REST风格架构体系密不可分,那么我们理解一下REST架构风格具备哪些特质:

1)客户端-服务器体系结构;

2)无状态;

3)可缓存;

4)统一接口;

5)分层系统;

6)按需编码(Code-On-Demand);

这里推荐:《Architectural Styles and the Design of Network-based Software Architectures》-- ROY T. FIELDING;

如果视频的传输可以基于这样一套架构体系来设计,也可以获得同样的质量属性。但是越来越多实时性要求高的业务出现,这对基于REST风格架构体系的视频传输方式(HTTP、CDN、E2E时延很难满足百毫秒级的时延要求)带来了挑战。

目前大量实时性要求高的业务都采用基于UDP的RTC技术传输视频。由于业界目前没有类似REST这样达成共识的统一的架构风格,来满足可扩展、可靠、经济高效的视频传输需求,所以一般RTC服务提供方会提供较为封闭的方式来提供服务,即提供客户端SDK,各家采用各自的架构设计来达到可扩展、可靠、经济高效的视频传输的目的。

WebRTC提供了一个开源的参考实现,可以满足一定的开放性传输诉求。但是由于它的传输标准还有很多改进空间,同时依赖IETF进行标准化,所以演进速度不如封闭的方式来得快。这里就看各个应用的实际诉求来进行选择了。

LiveVideoStack:您认为在提供更好的视频传输方面的解决方案方面,除了华为云,还有哪家的思路让您觉得新颖有趣?

黄挺:最近出现了一些使用毫米波技术实现无线投屏和HDMI无线扩展坞的消费级产品,我觉得非常新颖,打算买个回来玩一玩。

LiveVideoStack:您如何看待“成本和技术复杂性往往面对着视频服务质量下降的Trade-off”这一说法

黄挺:这个和架构的设计一样,SLA希望做得更高,可能需要付出的成本就更大,例如冗余会更多,我想最终还是要回归产品的定位本身吧。当然架构和算法设计上灵活一些肯定会更好,但是这个也取决于各个团队的技术栈能力以及团队眼前的重要问题是什么。最近我们也在找一些人因工程方面的专家讨论视频服务质量这个话题,希望在视频服务质量的定义方面能有一些新的发现和突破。

云端协同创新,急速多模态媒体技术发展

LiveVideoStack:后疫情时代,您对音视频服务&技术有了哪些新的理解?

黄挺:后疫情时代,一些变化可能会逐步发生,我认为它们会以家庭为中心展开。

1、固定场景的应用越来越多,因为都在家里(安全性高)进行办公或者娱乐;

2、大屏的应用越来越多,有条件使用更好的显示屏;

3、新的显示、采集设备会加速推出,因为可以优先在固定场景使用,相较于移动场景需要解决的问题更少;

4、家庭场景下,重型娱乐和互动通信需求会逐步出现。所以后疫情时代会加速多模态媒体技术的发展,不仅仅是通过将音视频数字化来满足人类的诉求。还包括数字化人类的触觉、嗅觉和味觉来满足人们重型娱乐和办公的需求。

LiveVideoStack:您现阶段正在解决的问题以及您下一个阶段的研发目标是什么?

就是我在上次分享中提到的三点价值主张:

1、低时延、全互联、大规模实时音视频分发;

2、高通量、沉浸式新媒体传输;

3、端、边、云协同创新,灵活定义媒体处理流水线。

LiveVideoStack:您在LiveVideoStackCon北京站的分享中有提到过音视频传输未来面临的三大挑战:业务多、要求高、发展快,您这里提到的“未来”指的是多久的时间维度?为应对这些挑战,华为云做了哪些具体的准备,其中已经落地的产品项目有哪些?

黄挺:分享中提到的三大挑战已经是可看到的了,我认为现在就要开始做技术准备。我们针对这三大挑战都有具体的项目在跟踪落地,华为从研究到商业化落地有一整套流程支撑。

业务多:为了应对边缘越来越多不同类型的服务,我们的RTC等新构建的产品已经开始基于华为的边缘云产品、IEF、IEC进行构建,解决烟囱式资源管理的问题,并且大大提升了产品的运维效率。

要求高:可以看到华为云已经在VR和自由视角等新的沉浸式媒体方向进行了探索,并已经可以提供稳定的产品和解决方案。

LiveVideoStack:您如何看待视频传输当下的发展以及今后十年的发展趋势?

黄挺:5G、新的穿戴设备是几个影响视频传输发展的变量,我比较期待接下来2年的东京奥运会和北京冬奥会上有哪些视频技术的应用会给我们带来惊喜。AR和VR是视频发展甚至是整个计算和终端产业发展的下一跳。

 

点击关注,第一时间了解华为云新鲜技术~

posted @ 2020-12-18 10:18  华为云开发者联盟  阅读(518)  评论(0编辑  收藏  举报