算力网络概述
算力网络
本文来源于这篇博文,我认为写的很好,也方便以后查阅,便摘录过来了,侵删
一、算力网络的基本概念
1. 什么是算力
- 算力的字面意思,是计算能力(Computing Power) 。
- 具体来说,算力是"通过对信息数据进行计算处理,实现目标结果输出"的能力。
- 传统的算力,仅指信息计算力;现在的算力,通常包括了信息计算力、数据存储力、网络运载力。
2. 算力的发展
计算机算力的发展
大型机时代 | PC时代 | 云计算时代 | 人工智能时代 |
---|---|---|---|
1940-1980s | 1980-2000s | 2000-2020s | 2020- |
3. 算力的分类
类型 | 类型 | 举例 |
---|---|---|
通用算力 | 消费互联网、行业互联网、政府互联网等领域的常规计算应用。 | |
超算算力 | 科学计算类 | 物理化学、气象环保、生命科学、石油勘探、天文探测等。 |
工程计算类 | 计算机辅助工程、计算机辅助制造、电子设计自动化、电磁仿真等。 | |
智算算力 | 人工智能计算 | 包括:机器学习、深度学习、数据分析等。 |
4. 算力的硬件基础
目前,云计算(分布式)是最主要的算力服务提供形式,服务器是最常见的算力载体。
服务器的主要分类
分类标准 | 说明 |
---|---|
按指令集分类 | x86服务器、ARM服务器、MIPS服务器、其它CPU服务器.... |
按产品形态分类 | 塔式服务器、机架式服务器、刀片服务器、高密服务器..... |
按用途分类 | Al加速服务器、应用服务器、边缘计算服务器..... |
最主要的算力硬件,是芯片(处理器)
- 通用型芯片(CPU、GPU等,XX处理单元)
- 专用型芯片(ASIC,应用型专用集成电路)
- 半定制化芯片(FPGA,现场可编程门阵列)
处理器类型 | 英文全称 | 中文全称 |
---|---|---|
APU | Accelerated Processing Unit | 加速处理器 |
CPU | Central Processing Unit | 中央处理器 |
DPU | Data Processing Unit | 数据处理器 |
GPU | Graphics Processing Unit | 图形处理器 |
NPU | Neural Network Processing Unit | 神经网络处理器 |
TPU | Tensor Processing Unit | 张量处理器 |
5. 算力的衡量
- 算力既然是一个“能力”,就会有对它进行强弱衡量的指标和基准单位。
- MFLOPS、GFLOPS、TFLOPS、PFLOPS等,都是FLOPS的不同量级。
衡量标准 | 中文全称 | 中文全称 |
---|---|---|
MIPS | Million Instructions Per Second | 每秒钟执行的百万指令数 |
DMIPS | Dhrystone Million Instructions executed Per Second | Dhrystone每秒钟执行的百万指令数 |
OPS | Operations Per Second | 每秒运算次数 |
FLOPS | Floating-point Operations Per Second | 每秒浮点运算次数 |
Hash/s | Hash Per Second | 每秒哈希运算次数 |
衡量单位 | 英文全称 | 中文全称 |
---|---|---|
MFLOPS | megaFLOPS | 每秒一百万(=106)次的浮点运算 |
GFLOPS | gigaFLOPS | 每秒十亿(=109)次的浮点运算 |
TFLOPs | teraFLOPS | 每秒一万亿(=1012)次的浮点运算 |
PFLOPS | petaFLOPS | 每秒一千万亿(=1015)次的浮点运算 |
EFLOPS | exaFLOPS | 每秒一百亿亿(=1018)次的浮点运算 |
ZFLOPS | zettaFLOPS | 每秒十万亿亿(=1021)次的浮点运算 |
不同时代算力硬件的能力对比,如下:
算力*台 | 算力大小 |
---|---|
ENIAC(世界上最早的数字电子计算机) | 300 FLOPS |
8086处理器(英特尔) | 710000 FLOPS |
Pentium 4 HT 3.6Ghz(英特尔) | 7000000000 FLOPS |
Geforce GTX 1080Ti(英伟达) | 10800000000000 FLOPS |
骁龙888AI(高通) | 26000000000000 FLOPS |
天河一号 | 2566000000000000 FLOPS |
神威·太湖之光 | 125000000000000000 FLOPS |
6. 算力的作用价值
-
算力是数字时代的生产力,是数字社会的基石底座,是所有信息系统的动力引擎。
-
算力影响着数字生活的体验,支撑着数字经济的发展,推动着各行各业的数字化转型。
-
算力是国家、社会、企业的核心竞争力。
-
算力水*,已经成为衡量国家经济社会发展的重要指标。
-
算力水*的评估维度:基础设施支持、计算能力、计算效率、应用水*。
-
算力与经济增长紧密相关。计算力指数*均每提高1个点,数字经济和GDP将分别增长3.3‰%和1.8%‰o。
-
根据统计,IT支出每投入1美元(约7元),就可以拉动15美元(约107元)的数字经济产出,以及29美元(约208元)的GDP产出。
7. 国内的算力现状
- 2021年,我国的算力核心产业规模达1.5万亿,关联产业规模超过8万亿。
- 目前,我国算力产业规模快速增长,*5年*均增速超过30%。
- 截至2022年6月底,我国在用数据中心机架总规模超过590万标准机架,服务器规模*2000万台,算力总规模超过150 EFLOPS,位于全球第2位。
8. 算力的未来趋势
- 算力规模持续增长
- 根据罗兰贝格的预测,从2018年到2030年,自动驾驶对算力的需求将增加390倍,智慧工厂需求将增长110倍,主要国家人均算力需求将从今天的不足500 GFLOPS,增加20倍,变成2035年的10000 GFLOPS。
- 根据浪潮人工智能研究院的预测,到2025年,全球算力规模将达6.8ZFLOPS,与2020年相比提升30倍。
- AI智算比例增加
- 人工智能高速发展,产生了巨大的智算需求。
- 有专家预测,人工智能计算需求未来将占据所有需求的80%以上。―算力需求多样化
- 摩尔定律放缓,算力硬件遇到发展瓶颈;算力的区域分布不*衡;算力利用率低,存在算力的浪费。
- 算力的发展趋势包括:形态多样、空间泛在、智能敏捷、安全可靠、绿色低碳。
二、算力网络的基本概念
1. 算力网络的定义
- 算力网络不是一项具体的技术,也不是一个具体的设备。
- 从宏观来看,它是一种思想,一种理念。
- 从微观来看,它仍然是一种网络,一种架构与性质完全不同的网络。
2. 算能力网络的作用
-
算力网络的核心目的,是为用户提供算力资源服务。
-
但是它的实现方式,不同于“云计算+通信网络”的传统方式,而是将算力资源彻底“融入”通信网络,以一个更整体的形式,提供最符合用户需求的算力资源服务。
-
算力网络,也被称为“Network As A Computer (网络即计算机)”。
传统的算力服务模式 | 算力网络的服务模式 |
---|---|
3. 算力网络的诞生背景
- 算力侧(主要驱动力)
- 算力需求越来越大,用户需要多样化的算力,算力服务需要细化(通用算力、超算算力、智算算力)。
- 算力增长受限,需要加强算力的资源流动分配。
- 算力需求无处不在,需要算力能够"泛在化”"。
- 网络侧(次要驱动力)
- 传统网络过于封闭,需要引入以云计算为代表的IT技术,走向开源、池化、软件化。
- 传统网络也需要用到算力,引入算力的支持。
- 运营商需要盘活算力资源和网络资源,“借云卖网,借网卖云"。
4. 网络的演进
连接型网络 | 云服务网络 | 算力服务网络 | |
---|---|---|---|
时间阶段 | -2010 | 2010 - 2020 | 2020 - |
关注指标 | 速率、容量、覆盖 | 速率、容量、覆盖、时延 | 速率、容量、覆盖、时延、抖动(确定性时延)、安全、绿色、成本... |
主要目的 | 人的连接 | 人、物、云的连接 | 人、物、算力的连接 |
5. 算力网络的发展阶段
1.0阶段 | 2.0阶段 | 3.0阶段 | |
---|---|---|---|
中国电信 | 云网协同 | 云网融合 | 云网一体 |
中国移动 | 泛在协同 | 融合统一 | 一体内生 |
中国联通 | 协同供给 | 融合运营 | 一体共生 |
鲜枣课堂 | 云网协同 | 云网融合 | 算网一体 |
(1) 云网协同阶段
- 阶段特点:云和网刚开始合作,双方还是强调各自的主体身份合作关系。
- 云可以调动网络(“云调网” ),网络也可以配合云。
- 代表技术: SDN(软件定义网络)、NFV(网元功能虚拟化)、MEC(边缘计算)。
(2) 云网协同阶段(边缘计算)
- 将中心云的一部分算力下沉,放到通信网络的各个层级
- 更加靠*用户,能够满足用户低时延算力的需求;
- 彻底颠覆了"“非端即云"”的传统算力架构,使得算力资源变成了“云、边、端”三级模型。
(3) 云网融合阶段
- 阶段特点:云网协同取得初步成功,开始走向全面融合。
- 网络彻底失去了和算力*起*坐的资格,开始加速与算力的“融合”。坦率地说,是被算力“融合”。
- 融合的最终目的,是算和网完全合为一体,即“算网一体”。
算力网络的英文名
- CPN (Computing Power Network,计算能力网络)
- CFN (Computing First Networking,计算优先网络)√最常月
- CFN (Computing Force Networking,计算力量网络)
- CAN (Computing-aware Networking,算力感知网络)
6. 算力网络的本质
- 通过相关计算和通信技术,实现了对算力资源、网络资源的全面接管;
- 可以让网络实时感知用户的算力需求,以及自身的算力规模和分布状态;
- 经过分析后,灵活组合编排,智能决策,调度不同位置、不同类型的算力资源,为用户服务。
7. 算力网络的关键特征
- 弹性:可以提供"带宽可调整、时长可定制"的弹性连接服务。
- 敏捷:具备泛在算力敏捷接入的能力,用户不需要关心网络中的算力资源和分布情况。
- 安全:可以实现数据的安全存储和加密传输,可以有效应对外部攻击和数据泄露风险。
- 感知:为不同的应用提供差异化的SLA保障,能够“感知应用”、“感知体验”。
- 可视:通过应用、算力、网络三者的映射关系和图层建模,形成算和网的高效关系映射。
8. 算力网络的主要功能
- 算力路由:网络能感知算力,并为其提供最优算力路由。
- 算力调度:算网大脑智能编排、弹性调度全网算力资源。
- 算力交易:基于区块链的算力可信和算力网络交易*台。
三、算力网络的整体架构
1. 举例
(1) 中国移动
2. 中国联通
(3) 中国电信
(4) 鲜枣课堂
2.. 架构
(1) 算网基础设施
- 算力网络的最下层,是算网基础设施层。
- 在算力网络中,基础设施不再仅仅是算力资源(CPU、存储GPU等),还包括了网络资源。
- 算力资源这边,对算力基础设施的整合,依旧是以云技术为核心,包括云原生、虚拟化、容器等。
- 底层新技术创新,包括异构计算、无服务计算、存算一体、算力卸载等
- 网络资源这边,变化比较大。原来封闭的网,变得更开放(解耦),引入了软件定义。
- 网络的底层(物理层、数据链路层),以光为主(只有光,才能保证通信带宽和容量等基本硬指标)。
- 传输网的技术,包括OTN.OXC、ROADM、C+L频段、400G/800G等。接入网,包括5G NR、PON(50G-PON)等。
(2) 算网一体(算力资源管理、网络资源管理)
算力网络要调度算力和网络资源,所以,需要对资源进行“预处理”和“衔接”。
- 算力感知
- 算力感知是网络对算力资源和算力服务的部署位置、实时状态、负载信息、业务需求的全面感知。
- 一方面,各算力节点将算网信息度量建模后统一发布,网络通过对多节点上报的算网信息进行聚合,构建全局统一的算网状态视图。
- 另一方面,网络完成对业务算网需求的统一解析,实现对业务的全面感知,为基于业务需求进行算力调度提供保障。
- 算力感知的目的,就是摸清手上到底有多少资源,用户到底有怎样的需求。
- 算力度量
- 算力存在多样性,也存在异构硬件芯片,所以,需要形成统一的度量体系和标准,以便建立统一的算力模型。
- 算力标识
- 相当于算力的身份证。用户通过算力标识指示所需服务,网络通过解析算力标识获取目标算力服务、算力需求等信息,为算力调度等提供基础。算力标识,必须是全局统一且可验证的。
- 算力路由
- 算力路由层是算力感知网络的核心功能层,支持对网络、计算、存储等多维资源、服务的感知与通告,实现“网络+计算”的联合调度。
- 算力路由层,包括算力路由控制技术和算力路由转发技术,实现业务请求在路由层的按需调度。. CFN是一种分布式路由协议,在不同边缘云之间,按需进行着算力的调度和均衡。
- 算力路由和CFN,是上一层进行算力调度的前提。
(3) 编排管理
-
再往上,就是算力网络的核心关键部分——编排管理。编排,就是完全控制和调度。
-
算力网络的第二大特性
,就是算力调度。 -
算力调度,就是基于算网大脑,进行全网算力资源的智能编排、弹性调度。
-
更具体来说,是:完成算力运营及算力服务编排,完成对算力资源和网络资源的管理,包括对算力资源的感知、度量和OAM管理等;实现对终端用户的算网运营,以及对算力路由层和网络资源层的管理。
-
算力资源被感知、标识和感知之后,为了进行管理,还有一个算力资源管理的逻辑过程(也有被单独称为:算力管理层)。主要包括算力注册、算力OAM(性能监控、故障管理)、算力运营(计费管理、服务合约等)。
-
调度和编排算力网络的核心控制部分,有的运营商把它叫做“算网大脑”。
-
“算网大脑”有四个重要的作用:
- 获取全域实时的算、网、数资源,以及云、边、端分布情况,构建全域态势感知地图。
- 跨域协同调度,将多域协同的调度任务智能、自动地分解给各个使能*台,实现算、网、数的资源调度。
- 多域融合编排,针对多域融合业务需求,基于算、网、数的原子能力按需灵活组合编排。
- 智能辅助决策,基于不同业务的SLA要求、网络整体负载、可用算力资源池分布等因素,智能、动态地计算出算、网、数的最优协同策略。
-
算网管理编排层,维护全局静态的算力、服务和网络拓扑信息,并同步给各入口算力路由节点。算力路由节点维护算力服务的拓扑信息以及算力资源和网络的资源实时状态信息,通过分布式算力路由节点进行算网协同调度。
-
“算网大脑”是算力网络的神经中枢,统筹全局资源,重要性不言而喻。
-
在“算网大脑”中引入Al人工智能、“数字孪生”、“意图引擎”,可以提升“算网大脑”的智能化水*。
(4) 服务运营
-
服务运营层,给上层应用提供管控算力网络的接口。
-
算网大脑不是真正的老板,只是一个“大管家”。真正管控网络的,是上层用户和应用。
-
服务运营层的目的,就是向上提供算力网络的能力开放。重点技术包括:算力交易、算力并网、算力封装、意图感知等。
-
算力网络的第三大特性,就是算力交易。它是算力网络的一个重要创新
-
在算力和网络没有融合之前,用户使用谁家的云计算,就给谁钱,使用谁家的通信网络,就给谁钱。算网融合后,算力到处都是,调度来调度去,你到底该给谁钱?算力交易,就是为了解决这个问题
-
在算力交易场景中,会有一个可信泛在算力交易*台。
算力交易的基本过程:
- 算力消费方提出详细的算力需求。
- 算力交易*台根据需求,将可用的资源整合,生成一个算力网络资源表。根据时延和成本等因素,会有对应的报价。.
- 算力消费方根据资源表,选择一个最适合自己的“套餐”。
- 就是在算力交易*台上签订交易合约。
- 交易*台根据合约,通过算力网络调度资源,并且更新资源信息。. 6.合约结束,服务终止,释放资源。。
四、算力网络的当前进展
1. 算力网络的标准进展
2019年,是公认的算力网络元年。*年来,国内运营商陆续发布了多本白皮书,以及积极推动算力网络的标准制定。
发布日期 | 发布单位 | 白皮书名称 |
---|---|---|
2019年11月 | 中国联通 | 《中国联通算力网络白皮书》 |
2019年12月 | 中国移动、华为 | 《算力感知网络技术白皮书》 |
2020年10月 | 中国联通 | 《算力网络架构与技术体系白皮书》 |
2020年11月 | 中国电信 | 《云网融合2030技术白皮书》 |
2020年12月 | 开放数据中心委员会 | 《数据中心算力白皮书》 |
2021年3月 | 中国联通、华为 | 《云网融合向算网一体技术演进白皮书》 |
2021年5月 | 中国移动 | 《算力感知网络CAN技术白皮书(2021版)》 |
2021年11月 | 中国移动 | 《算力网络白皮书》 |
2022年6月 | 中国移动 | 《算力网络技术白皮书》 |
2022年7月 | 中国移动 | 《移动云向算力网络演进白皮书》 |
2022年7月 | 紫金山实验室等 | 《确定性算力网络白皮书》 |
2022年7月 | 中国电信 | 《中国电信云网运营自智白皮书》 |
标准组织 | 进展 |
---|---|
ITU | 2019年10月,FG Net2030:算力网络由电信、移动、华为联合写入NETWORK2030研究报告 2019年10月,SG13: 中国移动主导的“算力感知网络的需求及应用场景”立项通过,成为算力感知网络首个国际标准项目; 中国电信主导的“算力网络架构与框架”立项通过,分配项目编号为Y.CPN-arch; 中国移动主导了Y.IMT2020-CAN-Req; SG11:中国联通主导了Q.CPN、Q.BNG-INC等; 2021年7月,SG13: 开启Y.2500系列编号; 通过了由中国电信牵头的算力网络框架与架构标准(Y.2501),是首项获得国际标准化组织通过的算力网络标准; 中国电信成功立项Y.NGNe-O-CPN-reqts标准; 中国联通、中国电信成功立项Y.ASA-CPN标准,研究算力网络认证调度架构。 |
BBF宽带论坛 | 2019年8月,华为牵头,联通、电信、移动、BT等联合,以Metro Computing Network(城域算网))为名完成立项(SD-466) |
IETF | 2019年11月召开的IETF 106会议上,中国移动联合华为组织了计算优先网络(Computing First Networking)”的技术研讨会,主导提交了三篇核心提案。 Compute First Networking (CFN) Scenarios and Requirements Framework of Compute First Networking (CFN) A Report on Compute First Networking (CFN) Field Trial |
CCSA | 有序开展算力网络总体架构技术要求等6项系列标准工作 TC3 WG3(新型网络技术组):《算力感知网络的关键技术研究》研究课题立项; TC3 wG1(总体组)︰《算力感知网络的架构和技术要求》行业标准成功立项。 2022年2月23日,TC3 wG1(总体组)召开第67次会议,审查通过了行业标准《算力网络总体技术要求》送审稿。 |
网络5.0联盟 | 2019年9月,ECC联盟与网络5.0联盟联合成立ECNI(边缘计算网络基础设施联合工作组); 2020年,第8次网络5.0全会上,信通院联合三大运营商、中兴通讯等 |
IMT-2030 (6G) | IMT-2030 (6G)网络工作组也成立了算力网络研究组,研究6G网络中计算、网络融合对未来网络架构的影响。 |
IRTF | 互联网研究专门工作组(IRTF)成立了在网计算研究组(COINRG) |
日期 | 单位 | 进展 |
---|---|---|
2019年 | 中国移动、中国电信 | 均已完成算力网络领域的实验室原型验证,并在巴塞展、ITU-T和GNTC等展会上发布成果。 |
2020年底 | 中国联通 | 在江苏南京开通了中国首个集成开放网络设备、异刀服穷*白LAlAYP的─体化试验局。 |
2020年12月 | 中国电信 | 在网络5.0峰会上展示了业界首套算力网络交易*台。 |
2021年6月 | 中国电信 | 在未来网络大会上,结合脸识别应用,展示了算力网络交易管控系统。 |
2021年11月 | 中国移动 | 在中国移动产业链创新及算力网络论坛上,联合发布了多算力孵化*台“芯巢”。 |
五、算力网络的应用
1. 算力网络的应用场景
场景 | 说明 |
---|---|
生活消费场景 | 算力网络可以实现算力对消费者应用的加持,为用户提供智能化、沉浸式服务内容和体验。例如VR/AR元宇宙互动、云游戏、新媒体直播、智能家居等场景。 |
行业应用场景 | 算力网络通过深度融合AI、物联网、5G、云计算、大数据、数字孪生等技术要素,全面助力各个行业的数字化转型。如智能制造、智慧金融、智慧交通、智慧医疗、车联网等场景。 |
社会治理场景 | 算力网络可以广泛服务于智能科学模拟、数字化政府治理、*台型算力共享等场景,赋能社会的高效治理。 |
2. 东数西算
- “东数西算”,是一项重要的国家级战略。
- 通过构建全国范围的新型算力网络体系,将东部算力需求有序引导到西部,优化数据中心建设布局,促进东西部协同联动。
- “东数西算”是算力网络的一次大型实践。它让西部的算力资源更充分地支撑东部数据的运算,更好为数字化发展赋能。
“东数西算”有几个细分的应用场景:
- 东数西存(冷数据、温数据)
- 东数西渲(游戏、视频)
- 东数西训(人工智能)