云上创新,阿里云视频云分享全场景音视频服务背后的场景探索与技术实践
5 月 28 日 - 29 日,2021 阿里云峰会在北京国家会议中心隆重召开,从 “全面上云” 到 “云上创新”,标志着阿里云在 2021 年的全新重磅升级!阿里云 2021 年将加码投入三个方面,做好服务、云钉一体、数据智能,并在 “做深基础、做厚中台、做强生态” 战略基础上,新增 “做好服务” 方向,打造中国最大最好的数字化服务团队。
本次峰会,阿里云视频云联合达摩院、钉钉推出了优化音视频业务客户体验分论坛、低代码开发分论坛、视觉 AI 开放平台及行业应用分论坛。针对音视频全场景,阿里云视频云推出的互动课堂、互动直播、音视频会议、AI 媒体生产等一系列音视频解决方案和技术最佳实践,作为此次阿里云峰会的重要内容和议题,获得了各界参会嘉宾和行业的广泛关注,以低代码、高性能、强体验的音视频服务为全行业的视频化、线上化、数智化转型加速,展现了阿里云视频云在多行业多场景的深入探索和全面布局。
互动课堂,让教育更智能
阿里云视频云互动课堂产品负责人 王凯旋
教育的未来是基于数字技术的终身学习,未来的学习不再仅限于书本知识,更会扩展到工作技能、社交、认知、兴趣等更广泛的领域。根据麦肯锡的研究报告,预计到 2030 年,基于数字技术的在线教育平台将覆盖中国 9 亿以上的人口。
一个理想的在线教育平台核心环节有三个,首先是稳定的产品的平台,其次是高质量的课程,再者是优质的学习体验,这三个环节既包含了厂商、老师和学生的不同需求,还对音视频编解码、网络传输、AI 智能生产等众多技术提出了更高的要求,这对于任何以一个在线教育公司来说都不是一件容易实现的课题,它意味着很长的研发周期、高企的研发成本和深厚的技术壁垒,特别是一些传统的教育机构面临着更多的困难。
阿里云视频云最新推出的智能互动课堂解决方案,可以帮助各类教育机构一站式地快速搭建教学平台,它覆盖了所有主流的教学场景的功能,深入各类授课场景,直击在线教育实时互动痛点。
视频云智能互动课堂基于浅绿幕和深度学习技术,实现人像和课件背景的最佳融合,高度还原现场听课效果;通过手势识别、虚拟老师、体态动作识别等,丰富课程趣味性,让教育交互更加有趣。
针对在线课堂效果不透明的问题,互动课堂自动生成课堂报告,提供专注度检测,提升授课质量和学习效果。此外,场景化的 AI 组件聚焦音乐、美术、美妆穿搭、棋类等,帮助教育机构快速灵活搭建自有品牌的在线互动课堂,满足更多素质教育和兴趣教学场景。
互动直播,重塑业务场景
阿里云视频云产品解决方案架构师 王艮
直播已经成为行业标配。2020 年前三季度新增近 2.5 万家与视频直播相关企业,较去年同比增长 565.32%,“直播 +”模式重构传统场景、创新商业模式、促进直播向细分领域发展。
传统的互动直播业务包括基础能力构建、实时互动、内容传播,需要很高的人力开发成本,而阿里云视频云期望给大家提供更快接入、便于互动、高效分发、安全稳定的互动直播服务。
在阿里云视频云看来,真正面向未来的直播服务应该具有高度的互动性,它具备了快速搭建、超低成本、相互嵌合、智能安全等特点。
在阿里云视频云的服务体系下,各类客户都可以通过 LowCode 平台,快速接入业务变现;以丰富的原厂组件和场景化的互动组件,提升 C 端互动体验;基于 AliRTC+AliRTS+AliIM 提升转化效率,实现高效分发;
基于阿里先进的多模态内容理解 AI 技术和万亿级数据资源保障直播安全。
阿里云视频云互动直播解决方案促进了客户的业务发展,以某头部母婴社交 APP 为例,通过阿里云视频云超低延时直播 RTS 产品的应用,其直播延迟降低 80% 以上,卡顿率降低 20%,大大提升了实时互动体验,使 UV 和 GMV 指标得到极大提升。
音视频会议,连接企业办公孤岛
阿里云视频云音视频会议产品负责人 程熙
音视频会议和云有什么关系呢?在新冠疫情没有爆发之前,我们一直认为音视频会议是一个私有化的解决方案,疫情期间,我们发现上云的大范围接入、弹性化的部署、高的并发与会议是天然的结合在一起。去年一年内,许多云会议产品得到广泛的应用,钉钉就是其中之一。
钉钉在 2020 年支持了 1.2 亿人次进行视频会议,同时的在线会议数超过了 2000 万,超过 1000 万家的组织和企业在钉钉上进行了远程视频会议。
“在服务了这么多企业和支撑了这么多业务的同时,我发现了非常难的一点,那就是连接非常困难,真的非常困难,特别是对于很多数字化转型优势并不明显的中小型企业”,阿里云视频云音视频会议产品负责人程熙分享到,“疫情之前钉钉会议的能力是 16 方,疫情期间我们立马将钉钉的会议能力提升至 302 方,为疫情后的复工复产做了努力,而这仅是我们去年一直在为打通连接做的努力之一”。
过去一年,阿里云视频云着力践行着连接各企业业务孤岛这件事,从语音系统、人员系统、邮件系统,到日程、行政系统,甚至是会议室管理系统,我们希望让连接变得更加不同,让协作变得更有效率。
在实践中阿里云视频云团队发现,随着需求个性化性、人员数量极剧增加和设备型号更加复杂,业界需要新的基于 “云端一体” 架构的一站式会议解决方案。
此次推出的阿里云一站式会议解决方案,打通了会前、会中、会后的全会议流程,提升了整体的办公协同能力,连接办公业务孤岛,通过稳定的高性能、低成本的音视频连接人、业务及设备,为客户提供简单易用稳定可靠的音视频协同体验。
低代码,让业务数字化触手可及
阿里云视频云资深技术专家 胡洪卫
低代码是一种构建、运行和管理应用的方法论和一种应用场景的极致抽象思维,低代码的平台有很多优势,比如模型驱动、模版化;元数据编程、可视化编程、全生命周期管理、良好的可扩展性等等。
从上个世纪 80 年代到今天,低代码的技术演讲整整跨过了 30 年的时间,目前行业都很看好低代码这一技术,有机构预测低代码的市场总规模在 2022 年将会达到 212 亿美元。
阿里云视频云互动课堂解决方案的技术架构正是基于低代码设计原则而打造的,方便很多没有代码搭建基础的教育客户迅速搭建在线教育服务。团队在技术架构的设计上,遵循了以下四个原则:
配置化:零代码、低代码的可配置集成方案,更低门槛。
场景化封装:场景化 SDK、Demo 封装,更直观,更简单。
模块化设计:媒体能力、场景应用模块化实现,按场景动态组装,能力更强。
易扩展:云、端 API 可扩展,满足业务做深、做厚的更多需求。
此套低代码解决方案的打造,将会帮助客户速度更快、成本更小、门槛更低、随时随地搭建自己的互动课堂来完成教学任务,让原本不具备的业务运营人员同样具备技术开发的能力,快速响应迅速变化的业务场景需求和变化,人人都成为工程师。
AI 智能生产,释放数字传媒内容生产力
阿里云视频云高级技术专家 邹娟
随技术的进步,科技的发展,内容信息载体也由图片变为了视频。如今,互联网 70% 的流量来自于视频,人们的审美习惯也趋向于视频化,并且提出了更高的要求。
媒体生产的演进也呈现出从人工到智能、从小众到大众、从被动接收到个性互动的特点,视频制作全链路也发生了巨大变化,之前的视频制作必须由专业机构和专业的非编软件来制作,而今天我们可以在手机软件上或者在浏览器上进行在线编辑,之前的媒资审核需要人工来审核,转播需要转播车来转播,而现在仅仅需要一个小小的软件开发包就可完成。
今天在云计算的加持下,我们把整个媒体生产的模式提升到一个新的时代 —— 云端一体的智能生产架构。云端一体的智能生产架构包含了内容创意、素材管理、剪辑包装、渲染与合成四大核心环节,具有云导播、云剪辑、AI 处理生产等丰富的功能。
在云端一体的架构和 AI 能力的加持下,传媒行业的内容生产将会赋予更多可能性,这种生产化的模式将会极大地重塑行业,让真正的内容创作者从繁复的重复化劳动中释放出来,创造出更丰富的内容、形态、模式。
于此同时,随着 AI 技术的发展,机器也将更多的具备思考和进化的能力,在阿里云看来,AI 智能生产的未来就是机器可以进化成一个“艺术家”,与人类艺术家的思想碰撞出更多可能。
未来,基于视频云技术,阿里云视频云将不断深入到产业中、行业中、场景中,探究真实的场景痛点和潜在可能,打磨全场景音视频解决方案,以云端一体的音视频数智化能力,实现 “云上创新、价值创造”。
「视频云技术」你最值得关注的音视频技术公众号,每周推送来自阿里云一线的实践技术文章,在这里与音视频领域一流工程师交流切磋。公众号后台回复【技术】可加入阿里云视频云技术交流群,和作者一起探讨音视频技术,获取更多行业最新信息。