通过哈密顿蒙特卡罗(HMC)拟合深度高斯过程,量化信号中的不确定性

本文将介绍如何使用深度高斯过程建模量化信号中的不确定性

先进的机器学习 (ML) 技术可以从数据中得出的非常复杂的问题的解答。但是由于其“黑盒”的性质,很难评估这些答案的正确性。如果想在照片中找到特定的人或者物,例如在照片中找到猫的照片,这可能是很适用的。但在处理医疗数据时,因为可解释性的原因一般都不会被人们所接受,这导致 ML 模型在实际临床应用中的实际使用的概率很低。在这篇文章中,将介绍一种分析生物数据的方法,它结合了现代 ML 的复杂性和经典统计方法的合理置信度评估。

本文的目标是提供

  • 对生物数据使用高斯过程建模的合理性,特别是深度高斯过程 (DGP),而不是普通的静止过程
  • 哈密顿蒙特卡罗 (HMC) 方法概述及介绍其对 DGP 建模的帮助
  • 该方法在模拟数据示例中的应用说明

分析医疗数据的挑战

想象一下,医生正在监测一位接受过治疗的患者。假设治疗应该影响某种激素的水平。随着时间的推移,我们记录测试结果,并逐渐得到这样的图表。

这显然是一个带有噪声的数据。我们无法立即知道发生了什么,但我们很想知道激素水平是否正在发生变化。一般情况下第一件事将数据拟合到线性回归模型,因为这是最简单的模型。但是在大多数现实世界的临床数据中,这几乎不会得到给出任何信息。所以我们要选择一种更好的方法,比如将其建模为高斯过程(GP)为什么呢是告诉过程呢?

首先,让我们回顾一下什么是高斯过程(GP)。

将临床信号视为平稳高斯过程

当执行 GP 建模时,所有数据点都被认为是从多元高斯分布中提取的

这里有两点需要注意。1)这里的K(X)是数据大小的方阵,包含非零的非对角元素;这与将数据视为n次独立随机抽取不同。2) 数据点由 X 索引,例如在我们的示例中,将顺序定义为时间 - 因此,过程就是我们需要了解的关于 GP 的全部内容。

当提到拟合 GP 时,我们的意思是找到矩阵 K(X) 的参数。为了使其更明确,让我们将 GP 模型重写为

现在有了三个参数,在这里我们提出一个论点:三个参数可以被解释为捕捉尝试建模的过程的不同方面。

当我们分析随时间变化的医学信号时,我们像解决的问题是通过医学测试来评估某些生物在很多噪音的背景下进化的过程。这里可以将噪声源大致分为两类。一个是测量噪声,随着现代医学的测试变得非常复杂,会在测量时产生不同程度的偏差,这个是无法避免的。另一个来源是生物过程引起的变异,这与我们感兴趣的过程无关并且更加复杂,相对的研究也少得多。所以实际的信号(我们试图检测的过程)可能是高度非线性的,这些都会造成数据的混乱,所以一般不会对其进行精确建模,至少在可预见的未来是这样的。

但是我们可以尝试在 GP 框架中对这三个参数进行半独立的建模。比如说获得一个最有可能的结果,两个噪声源的频率和振幅不同。

  • g参数是线性回归分析中随机噪声的产物。从技术上讲它是 τ²g,这是“半独立”的来源,也很容易解释。将此参数与测量噪声联系起来是最自然的,只要我们谈论的是相同类型的测量,这种类型的噪声不会因患者而异。它甚至可以通过重复测试并在进行每次训练时并保持一致。这里指定的生物噪声用 τ² 表示是因为该参数负责变化的幅度。这很可能取决于患者,但在同一患者的监测时间内或多或少保持不变。
  • θ 负责描述数据点彼此之间的相关程度。如果我们正在观察正在接受治疗的患者,并且治疗实际上正在发挥作用,那么它将在连续测量中反映为强相关。因此,θ 参数是为我们试图检测的信号保留的。

GP 模型可以巧妙地满足我们将一些数学理论放在医学数据上的需求。这是比线性回归的一个很好的进步。但是有一个问题,假设模型的所有参数保持不变。这对于 g 和 τ² 参数可能很好,因为正如上面所讨论的,这两个参数归因于测量噪声和不受治疗影响的身体生物变化。但θ的就不一样了,治疗可以停止也可以改变。这会影响信号的相关性,如果我们想知道这一点就必须考虑θ的变化。

该解决方案带有一个深度高斯过程模型。就像深度神经网络一样,添加更多层。

两层GP

有许多方法可以为GP添加层。这里我们使用简单的方法:在时间指标和测量信号之间插入另一个GP

遵循引用[2]的方法,为什么这就足够了?正如我们上面提到的,我们只需要适应θ的变化。通过为时间变量引入额外的GP,我们以一种灵活的方式“扭曲”了测量时间点之间的间隔,从而产生了预期的效果。

 

完整文章:

https://avoid.overfit.cn/post/be3e5d168e854c0daafc2845aad6d754

posted @   deephub  阅读(274)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
点击右上角即可分享
微信分享提示