3GPP技术趋势-5G-Advanced发展趋势(他山之石)-4
5. 人工智能 (AI) 和机器学习 (ML) 在基于 3GPP 的无线网络中的应用
本章节提炼了 3GPP 标准中定义的 5G 网络中 AI/ML 的精髓,首先探讨它们在增强网络智能和效率方面的作用。它深入研究了生命周期管理,概述了 AI/ML 模型开发、部署和维护的过程,以确保稳健的网络性能。最后,它强调了可信赖 AI 的重要性,重点关注作为可靠 5G 基础设施支柱的道德部署、透明性和安全性。
5.1 3GPP 中 AI/ML 概述
人工智能和机器学习最初进入 3GPP 是在网络自动化领域。在 Release 15 中,网络数据分析功能 (NWDAF) 的引入标志着 AI/ML 的到来,提供了网络切片分析能力。随后,它在 Rel-16 中扩展了其范围,包括数据收集和暴露在 5G 核心内,以及在 Release 17 中促进 UE 应用数据收集。
图 3. 人工智能/移动语言在 3GPP 中的演变
在 Rel-17 中,机器学习的整合进一步扩展到下一代无线接入网络 (NG-RAN)。技术报告 TR 37.817 概述了机器学习赋能 RAN 智能的原则。它深入研究了功能框架,并探索了各种支持机器学习的 RAN 的用例和解决方案。最初的一组用例包括:
-
网络节能:这种方法涉及单元激活和停用,战略性地在分层结构内卸载流量,以减少整个 RAN 的能源消耗。如果预期的流量低于预定义阈值,则可以关闭单元,并将连接的 UE 转移到另一个目标单元。
-
负载均衡:随着网络流量激增和商用网络中使用多个频段,实现平衡的流量分布成为一项复杂挑战。负载均衡方法旨在在单元和各个单元区域、载波或无线接入技术 (RAT) 之间公平地分配负载。这可能包括卸载拥塞单元或区域的用户。
-
移动管理:机器学习驱动的解决方案已被提出,以确保移动期间的服务连续性。这些解决方案将呼叫丢失、无线链路故障 (RLF)、不必要的切换和乒乓效应等问题最小化。除了基本的移动管理之外,优化领域还包括双连接、单元切换优化 (CHO) 和动态天线点选择 (DAPS),每个方面都呈现出移动增强方面的特殊性。
最后,在 Rel-18 中,AI/ML 扩展到了新的无线电空中接口,如图 4 所示。这是 5G-Advanced 将带来的一个显著改进。更具体地说,在 Rel-18 研究中,3GPP 正在研究需要网络 (NW) 和 UE 之间交互的机器学习解决方案。3GPP 将这些解决方案分为单边模型和双边模型。单边模型意味着机器学习解决方案的推理只发生在 UE 或只发生在 NW。3GPP 将其分别称为 UE 端模型和 NW 端模型。
图 4. 单边模型和双边模型
对于 UE 端模型,标准化的范围包括启用这些用例或使其比 3GPP 透明选项更有效的任何新信令和。以及建立网络控制机器学习功能的程序。对于 NW 端模型,可能需要一些额外的空中接口信令来使用例发挥作用,例如来自 UE 的辅助信息。
双边模型需要网络侧和 UE 侧之间更密切的协作,因为它假设 UE 和 NW 共同运行机器学习模型的推理。考虑到许多供应商不愿意公开他们的模型,3GPP 规范需要确保当模型分别开发/训练时与机器学习对应部分兼容。
在网络和 UE 之间的协作程度以及规范影响的不同程度方面,3GPP Rel-18 研究将三种不同的网络-UE 协作级别分为:
-
级别 x:无协作;仅基于实现的 AI/ML 算法,无信息交换。
-
级别 y:基于信令的协作,无模型转移,网络参与管理 UE 侧的功能/模型。
-
级别 z:基于信令的协作,带有模型转移,网络参与管理 UE 侧的功能/模型,并且模型从网络转移。
该研究考虑了三个代表性用例。
-
波束管理:包括空间域和时域的波束预测。主要目的是减少选择最佳波束所需的测量次数,同时不影响系统性能。
-
CSI 增强:包括 CSI 压缩和 CSI 预测。CSI 压缩采用双边模型进行。UE 通过机器学习编码器压缩 CSI 反馈,gNB 通过机器学习解码器解压缩。目标是在相同的吞吐量性能下减少反馈开销,或在相同的开销下提高吞吐量性能——或两者结合。时域 CSI 预测允许 UE 跳过信道测量并改用预测。
-
定位:目标是提高准确性和降低开销。定位考虑直接方法(UE 坐标来自机器学习模型)和辅助方法(机器学习模型融入更大的非机器学习定位估计算法)两种方法。
在 3GPP 中,探索空中接口领域的 AI/ML 用例旨在建立一个可推广的机器学习框架。该框架在启用整个空中接口的机器学习应用程序方面发挥着关键作用,确保其多功能性,以便在未来版本中容纳更多用例,包括向 6G 的演进。
随着我们进入 Rel-19,我们预计将会在空中接口、无线接入网络 (RAN) 和整体系统架构中全面整合 AI/ML 用例。在 Release 20 中,6G 技术的研究将成为舞台中心,人工智能和机器学习将无缝集成到系统的核心。分布式学习等先进技术与深度嵌入网络基础设施和用户设备的人工智能协同工作,将显著提升整体性能和用户体验。
在这样的背景下,6G 作为由数据驱动的新一代移动网络,标志着移动通信技术范式的一大转变。
5.2 人工智能/机器学习功能的生命周期管理
在生产领域,“产品生命周期管理”一词被广泛用于指产品从构思到退役的循环阶段。产品可以是实物(硬件、机械)、计算机软件、服务或两者结合。在人工智能/机器学习领域,机器学习功能生命周期管理用于指一套使能机器学习应用流程的工具和流程。
在一些 3GPP 的讨论中,使用了“机器学习模型生命周期管理”术语,即使在最新的讨论中,很明显地,机器学习模型本身可能无法使用 3GPP 规定的机制进行完全管理,也不需要管理。机器学习模型需要一些数据预处理/后处理才能集成到控制管道中才能运行。因此,处理“功能”而不是“模型”更准确。LCM 程序的研究基于这样一个假设,即人工智能/机器学习模型拥有一个与其关联的信息和/或模型功能相关的模型 ID,至少适用于某些人工智能/机器学习操作。图 5 显示了支持机器学习的功能、功能和模型之间的关系。
图 5. 支持 ML 的功能
每个功能可能有多个功能实现。可能需要不同的功能来处理不同的场景(例如,室内和室外)。从技术上讲,功能在预处理/后处理算法、推理指令和底层模型方面可能有所不同。
为了维持和支持网络中 AI/ML 模型的使用,应实施 LCM 程序。这些程序可能因领域和用例而异。通常,它们包括:
-
数据收集
-
模型训练和更新
-
功能注册和识别
-
推理操作
-
功能/模型监控
-
功能、(去)激活、切换和回退操作
-
UE 能力
空中接口中机器学习解决方案的实用性在很大程度上取决于机器学习模型的可扩展性和泛化性。简单地说,这意味着一个机器学习解决方案在不同场景、设备和配置下的工作情况。为了更好地说明挑战,请考虑 CSI 压缩用例,其中网络供应商必须为每个 UE 供应商管理多个 NW 端模型。
从这个意义上说,我们需要寻求一种方案来促进多个专有 UE 模型的通用 NW 端模型。从多个 UE 供应商处收集的混合训练数据集可以是一种可行的选择,但其性能和可行性必须进一步研究。
理想情况下,所有可能的场景都可以由单个模型覆盖。然而,这在实践中需要大量工作才能实现。除此之外,更好的模型泛化通常会带来更高复杂度的代价。因此,在泛化和其他 KPI 之间取得合理的权衡是机器学习研究的关键方向之一。
5.3 可信赖的人工智能
随着机器学习在移动网络中继续普及,可信赖性问题变得越来越重要。可信赖性倡导了一套应该融入系统设计的基本原则:
-
可解释机器学习:该方面涉及机器学习模型为其决策和预测提供人类可读解释的能力,促进透明性和理解。
-
公平机器学习:机器学习的公平性涉及识别和纠正机器学习模型中的偏差,确保公平无偏的结果。
-
鲁棒机器学习:机器学习的鲁棒性是指自主管理不同类型错误、损坏和基础数据分布变化的能力,增强机器学习模型的可靠性和适应性。
这些特征适用于整个机器学习过程,涵盖四个关键方面:
-
数据处理:此阶段涉及训练、测试和推理的数据准备。
-
训练:使用数据训练机器学习模型以建立其预测能力。
-
测试:评估机器学习模型以衡量其性能和准确性。
-
推理:训练好的模型在现实场景中用于预测或决策的实际应用。
尽管机器学习可信赖性是 3GPP 中一个新兴话题,但由此范式启发的基本设计原则已经纳入 5G-Advanced。值得注意的是,TR 28.908 强调了在机器学习训练、测试和推理阶段管理 AI/ML 可信赖性的必要性,特别强调确保机器学习解决方案的可解释性、公平性和鲁棒性。
此外,由于机器学习对不同用例的影响存在不同程度的风险,因此对机器学习的可信赖性要求也可能发生相应的波动。因此,与可信赖性相关的机制必须针对每个特定用例进行单独配置和监控,以保持所需的可靠性和完整性水平。

浙公网安备 33010602011771号